Внимание! Форум временно закрыт. Все вопросы вы можете задать на странице MaxSite CMS в Github

Свой поисковый алгоритм: как оптимальнее?

Только для тех, кто понимает.
Аватар пользователя
nicothin
Модератор
Сообщений: 521
Зарегистрирован: 09 мар 2009, 21:55

Re: Свой поисковый алгоритм: как оптимальнее?

Сообщение nicothin » 30 дек 2013, 00:13

да, по идее — так. возможно, дело в том, что на локальной машине (винда 7 64, опенсервер) разрабатываю, но поиск регистрозависим, хотя все в UTF8.

Аватар пользователя
nicothin
Модератор
Сообщений: 521
Зарегистрирован: 09 мар 2009, 21:55

Re: Свой поисковый алгоритм: как оптимальнее?

Сообщение nicothin » 20 янв 2014, 05:53

Все поборол!
Логика:
стеммирую поисковые слова (первые три);
режу все неинформативные слова — http://take.ms/GhvAS ;
ищу в текстах, заголовках, доп. полях, метках, названиях рубрик;
полученные записи с совпадениями ранжрую (бальная система: кол-во совпадений умножается на некие индексы (разая значимость встречаемости в разных местах), потом все суммируется и вывод происходит начиная с «более тяжелых»).

http://htmllinks.ru/

Получилось, по-моему, весьма и весьма неплохо, в сравнении со стандартным поиском. И без крайне тяжелого анализа морфологии обошлось.

Аватар пользователя
MAX
Администратор
Сообщений: 3179
Зарегистрирован: 31 янв 2009, 19:02

Re: Свой поисковый алгоритм: как оптимальнее?

Сообщение MAX » 20 янв 2014, 10:50

А готовый search.php будет? ;)

Аватар пользователя
nicothin
Модератор
Сообщений: 521
Зарегистрирован: 09 мар 2009, 21:55

Re: Свой поисковый алгоритм: как оптимальнее?

Сообщение nicothin » 20 янв 2014, 13:59

MAX писал(а):А готовый search.php будет? ;)

отправил ссылку на механизм поиска и стеммер в личку.

Аватар пользователя
MAX
Администратор
Сообщений: 3179
Зарегистрирован: 31 янв 2009, 19:02

Re: Свой поисковый алгоритм: как оптимальнее?

Сообщение MAX » 20 янв 2014, 14:33

Спасибо, посмотрю.


Вернуться в «if (!is_type('Programmer')) die('not for you');»

Кто сейчас на форуме

Пользователь просматривает форум: нет зарегистрированных пользователей

cron