Индекс УДК | 651 |
Использование семантического анализа текста на основе машинного обучения для упрощения и автоматизации документооборота А. А. Колчин, Б. М. Усманов, Е. Н. Левченко |
|
Аннотация | Приведены методы улучшения качества семантического поиска структуризации узкоспециализированного текста. Рассмотрен конвейер обработки, включающий анализ языковой модели и различные стратегии разбиения на словосочетания и формирования эмбеддингов. Результатом работы стала программа, позволяющая осуществлять семантический поиск по корпусу неоднородных специализированный документов. Предложена инновационная стратегия создания эмбеддингов, которая повышает полноту результатов с минимальными потерями точности, выделены перспективные направления продвинутого текстового анализа. |
Название источника | Химия и технология топлив и масел |
Место и дата издания | 2024 |
Прочая информация | № 5. - С. 51-54 |