Разрешение конфликтов
Сердце системы. PHP-алгоритм, который объединяет догадки ИИ с жесткими данными словарей на основе матрицы приоритетов.
Итак, у нас есть два потока данных. ИИ (LLM) вернул нам красивую структуру предложения, а микросервис Pymorphy — сухую словарную сводку по каждому слову. В 20% случаев эти данные вступают в конфликт.
Матрица доверия (Trust Matrix)
Мы написали специальный алгоритм ultimateMerge, который работает как верховный судья. Он знает сильные и слабые стороны обоих инструментов.
- Абсолютное доверие Словарю: Вид глагола (совершенный/несовершенный), одушевленность, переходность. Эти параметры вшиты в само слово, они не меняются от контекста. Если ИИ говорит "несовершенный вид", а словарь "совершенный" — ИИ принудительно перезаписывается.
- Доверие ИИ (Контекст): Падежи. Слово «окно» в именительном и винительном падеже выглядит одинаково. Словарь Pymorphy не знает контекста и вернет сразу два варианта. ИИ видит фразу «Я смотрю в окно» и точно указывает: Винительный падеж. Алгоритм берет это значение у ИИ.
Пример работы Smart Merge
Благодаря этому процессу мы получаем лучшее из двух миров: железобетонную орфографическую и морфологическую точность от классических словарей и превосходное понимание омонимии и синтаксических ролей от нейросетей.