Поиск

Использование семантического анализа текста на основе машинного обучения для упрощения и автоматизации документооборота

Авторы: Колчин, А. А. Усманов, Б. М. Левченко, Е. Н.
Подробная информация
Индекс УДК 651
Использование семантического анализа текста на основе машинного обучения для упрощения и автоматизации документооборота
А. А. Колчин, Б. М. Усманов, Е. Н. Левченко
Аннотация Приведены методы улучшения качества семантического поиска структуризации узкоспециализированного текста. Рассмотрен конвейер обработки, включающий анализ языковой модели и различные стратегии разбиения на словосочетания и формирования эмбеддингов. Результатом работы стала программа, позволяющая осуществлять семантический поиск по корпусу неоднородных специализированный документов. Предложена инновационная стратегия создания эмбеддингов, которая повышает полноту результатов с минимальными потерями точности, выделены перспективные направления продвинутого текстового анализа.
Название источника Химия и технология топлив и масел
Место и дата издания 2024
Прочая информация № 5. - С. 51-54