- Главная
- Ранжирование в деталях
- Процесс обучения
Процесс обучения
Процесс обучения Матрикснет представляет собой схему взаимодействия человека и машины. Входными данными являются множество подобранных факторов и обучающая выборка, подготовленная асессорами. В этой выборке представлены как высоко оцененные сайты, так и нерелевантные.
Все входные данные загружаются в систему. Она обрабатывает страницы, выделяет в них показатели релевантных и нерелевантных сайтов. Эти факторы представлены в виде чисел, поэтому нахождение формулы сводится к подбору коэффициентов путем решения систем уравнений.
Вспомните, как за школьной партой вы решали простую математическую систему уравнений:
Аналогично можно представить составление формулы ранжирования: 20 и 29 — оценки асессоров, 2 и 5 — показатели двух факторов одного сайта, 3 и 7 — другого сайта; k1 и k2 — коэффициенты в формуле ранжирования, показывающие вклад каждого фактора в оценку релевантности.
В реальности алгоритмы и подходы выявления значимых факторов намного сложнее. Сами названия — регуляризация в листьях, gradient boosting, метод Ньютона для классификации, Ranking, Luce-Plackett model и другие — говорят за себя. Подробнее о них можно прочитать в статье Андрея Гулина «Matrixnet».
Вернуться назад: АрхитектураЧитать далее: Асессоры