RSS лента

Тарахтелка

Sphinx search - срываем покровы

Оценить эту запись
16.09.2011 в 02:26 (1045 Показов)
Сегодня обсудили с Андреем Аксеновым мои тест-кейзы для поиска. Если ограничить фишки только задачами этого форма, то добавится вот что:

- обработка словоформами составляющих blend-characters (которые слева и справа от минуса)
- обработка регулярками входных данных (для нормализациии чисел, размерностей и т.п.)
- появление для blend-characters третей формы, когда минус "схлопывается" (либо, как вариант - возможность это задать регуляркой.
- с тех же регулярок - возможность построить собственные аналоги blend-characters (одновременно несколько форм слова в индексе)
- в некоторых местах - уточнен порядок наложения словарей, стеммера, исключений и т.п.

По срокам - до нового года. Это только те вещи, у которых растут ноги от моих задач. Остальные секреты не мои, поэтому рассказывать буду только за деньги .

Предварительное "заседали-постановили" накропал в todo https://github.com/rcdesign/search-tune/ . Естественно, по бамажке еще не раз прокатимся катком и саблей, но куда все двигается - примерно понятно.

Обновлено 17.09.2011 в 03:46 [ARG:5 UNDEFINED]

Метки: sphinx search, поиск
Категории
Без категории

Комментарии