Семантический анализ текстов
3562 повідомлення
#12 років тому
А работал ли кто-то из вас в этой области? Есть ли желание продолжить?
1753 повідомлення
#12 років тому
Цитата ("SmartDesign"):А работал ли кто-то из вас в этой области?
Хм, нет как ни странно для меня самой. А что подразумевается? Может что-то что я делаю каждый день, а это оказывается называется так?

778 повідомлень
#12 років тому
А что конкретно интересует? И в чем заключается суть предложения (если это предложение конечно)?
6863 повідомлення
#12 років тому
По идее, эта процедура подразумевает создания некой статистики употребления слов с целью выбора ключевиков, или что-то типа того. Угадала?
3562 повідомлення
#12 років тому
Нужно научиться вычленять из текста сущности (объекты, события) и устанавливать связи между ними.Если с этим когда-нибудь работали - то вопросов "что это" - не возникнет, такое не забывается =)
3562 повідомлення
116 повідомлень
#12 років тому
Я с таким работал, подтверждаю - не забывается.Наша задача была простой - обойти существующие алгоритмы поисковиков по вычленению дублирующего контента.
Инструментарий такой: Erlang, Neo4j, MySQL, C++, ObjC
Схема работы - контейнер с фильтрами и нейросетью, льешь в него все, что можно: RSS, Pipes, HTML, plain text. Терабайты всего.
Потом открываешь кран на выходе и у тебя - отличный уникально-чистейший контент.
Для сбора информации в контейнер у заказчика было 50 тыс. приватных проксей и ботнет из 1,5 млн. зомбей -, наверно, только так это и можно было монетизировать.
В качестве бонуса узнал, что японцы - классные специалисты по семантическому анализу английского: куча публикаций на тему определения ключевых слов.