parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Мысли о работе поисковика

Nexus 18.11.2002 14:18

1) Есть такая функция SOUNDEX (см. MySQL help), возвращает число по строке.
2) Разбираем страницу(текст) по словам, записываем в таблицу
url текста, SOUNDEX, слово, смещение в тексте (число)
3) При запросе на поиск делаем поиск по SOUNDEX запрашиваемого слова
4) Релевантность высчитывается относительно кол-ва совпадений по url+по разности смещений в тексте (близость слов друг к другу)
5) Вывод выборки слов - по смещение запр. слова +100, по смещение запр. слова -100,
что даст выборку контекста.