НАУКА ОБРАЗОВАНИЯ - издательский дом

Switch to desktop

Материалы

АВТОМАТИЗАЦИЯ ОПИСАНИЯ ПРОФИЛЯ ПИВА С ИСПОЛЬЗОВАНИЕМ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА И СЕНСОРНЫХ ДАННЫХ

 

Журнал «НАУЧНАЯ ЖИЗНЬ»  [СКАЧАТЬ СТАТЬЮ В PDF]
ТОМ 20, ВЫПУСК 3, 2025 

Рубрика: АГРОИНЖЕНЕРИЯ И ПИЩЕВЫЕ ТЕХНОЛОГИИ
DOI: 10.35679/1991-9476-2025-20-3-744-754
   
Для цитирования:

Гулая Ю. В., Цыганков В. Ю. Автоматизация описания профиля пива с использованием обработки естественного языка и сенсорных данных // Научная жизнь. 2025. Т. 20. Вып. 3 (141). С. 744-754. DOI: 10.35679/1991-9476-2025-20-3-744-754

   
Авторы: 

Гулая Юлия Васильевна, аспирант, ассистент кафедры «Биологическая и биохимическая инженерия», ФГАОУ ВО «Дальневосточный Федеральный университет»: Россия, 690922, Приморский край, г. Владивосток, остров Русский, п. Аякс, 10.
Цыганков Василий Юрьевич, д-р биол. наук, доцент, ФГБУН «Тихоокеанский институт географии Дальневосточного отделения Российской академии наук»: Россия, 690041, Приморский край, г. Владивосток, ул. Радио, 7.

 

Тел.: (914) 076-99-46
E-mail: gulaia.iuv@dvfu.ru

   
Аннотация: 

В статье представлен научно обоснованный подход к автоматизации описания сенсорного профиля пива с использованием современных методов обработки естественного языка (Natural Language Processing, NLP) и анализа сенсорных данных, полученных в результате профессиональных дегустаций. В условиях цифровизации процессов производства и маркетинга пивоваренной продукции возрастает потребность в стандартизированных, объективных и воспроизводимых методах фиксации и представления органолептических характеристик продукта. Разработка таких методов актуальна как для крупномасштабных производств, так и для малых крафтовых пивоварен, стремящихся к устойчивому качеству и точной коммуникации свойств продукции с потребителем. Целью данного исследования является создание интеллектуальной системы на основе нейросетевых архитектур, в частности модели Bidirectional Encoder Representations from Transformers (BERT), способной автоматически обрабатывать неструктурированные дегустационные тексты и трансформировать их в структурированные описания, соответствующие профессиональным стандартам. Использование предобученных языковых моделей позволяет эффективно выявлять дескрипторы, классифицировать вкусоароматические характеристики и составлять текстовые профили продукции, пригодные как для внутреннего производственного анализа, так и для внешнего маркетингового применения. В рамках исследования рассмотрены этапы сбора обучающей выборки, её предварительная обработка, аннотирование ключевых признаков, формализация категорий сенсорных свойств, выбор оптимальных параметров модели, а также метрики для оценки точности и качества генерации текстов. Протестированные прототипы показали высокую степень соответствия получаемых описаний экспертным оценкам, подтверждённую как вручную, так и с использованием автоматических метрик (BLEU, ROUGE и др.). Предлагаемая система может быть внедрена в корпоративные информационные платформы, включая ERP- и CRM-системы пивоваренных компаний, а также использована в научных и исследовательских проектах, связанных с качественной оценкой продуктов питания. Полученные результаты подтверждают эффективность использования NLP и искусственного интеллекта в задачах сенсорного анализа и демонстрируют перспективы дальнейшего развития подобных технологий в смежных отраслях пищевой промышленности.

   
Ключевые слова: пивоварение, дегустация, нейросеть, искусственный интеллект, NLP, BERT
   

Список литературы:

1. Девлин Дж., Чанг М.-В., Ли К., Тоутонава К. BERT: Предобучение глубоких двунаправленных трансформеров для понимания языка // arXiv preprint arXiv:1810.04805. – 2018.

2. Васвани А., Шазир Н., Пармар Н. и др. Внимание – всё, что вам нужно // Advances in Neural Information Processing Systems. – 2017.
3. Миколов Т., Чен К., Коррадо Г., Дин Дж. Эффективная оценка представлений слов в векторном пространстве // arXiv preprint arXiv:1301.3781. – 2013.
4. Рэдфорд А., Нарасимхан К., Салиманс Т., Сутскевер И. Улучшение понимания языка с помощью генеративного предобучения. – 2018.
5. Чжан Ю., Уоллес Б. Анализ чувствительности (и практическое руководство) по сверточным нейросетям для классификации предложений // arXiv preprint arXiv:1510.03820. – 2017.
6. Браун Т., Манн Б., Райдер Н. и др. Языковые модели как обучение с малым числом примеров // arXiv preprint arXiv:2005.14165. – 2020.
7. Лю И., Отт М., Гоял Н. и др. RoBERTa: Оптимизированный подход к предобучению BERT // arXiv preprint arXiv:1907.11692. – 2019.
8. Хэ К., Чжан С., Жэнь С., Сунь Цз. Глубокое остаточное обучение для распознавания изображений // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2016.
9. Хинтон Г., Винялс О., Дин Дж. Дистилляция знаний в нейросети // arXiv preprint arXiv:1503.02531. – 2015.
10. Питерс М. Е., Нойман М., Айер М. и др. Глубокие контекстуализированные представления слов // arXiv preprint arXiv:1802.05365. – 2018.
11. Кингма Д. П., Ба Дж. Adam: Метод стохастической оптимизации // International Conference on Learning Representations. – 2015.
12. МакКан Б., Брэдбери Дж., Сионг Ч., Сочер Р. Обученное в переводе: контекстуализированные векторы слов // arXiv preprint arXiv:1708.00107. – 2017.
13. Пеннингтон Дж., Сочер Р., Мэннинг К. D. GloVe: Глобальные векторы для представления слов // Empirical Methods in Natural Language Processing (EMNLP). – 2014.
14. Чен Ц., Чжоу Ч., Ван В. BERT для совместной классификации намерений и извлечения слотов // arXiv preprint arXiv:1902.10909. – 2020.
15. Вулф Т., Дебю Л., Сан В. и др. Transformers: Современные технологии обработки естественного языка // Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing. – 2020.
16. Роджерс А., Ковалева О., Румшицкий А. Введение в бертологию: что мы знаем о работе BERT // Transactions of the Association for Computational Linguistics. – 2020.
17. Ян Чж., Дай Чж., Ян Ю. и др. XLNet: Обобщенное авторегрессионное предобучение для понимания языка // arXiv preprint arXiv:1906.08237. – 2019.
18. Ли Б., Чжан Чж., Ли Л. Обзор обработки естественного языка для винных обзоров // arXiv preprint arXiv:1903.02759. – 2019.
19. Лю Х., Су Цз., Шэнь Х. и др. Подходы на основе машинного обучения и сенсорного анализа для анализа продуктов питания и напитков // Food Quality and Preference. – 2021.
20. Цзинь Ц., Дхингра Б., Коэн В., Лу С. Исследование предобученных языковых моделей для сложных лингвистических задач // Association for Computational Linguistics. – 2019.
21. Куснер М. Дж., Сун Ю., Колкин Н. И., Вайнбергер К. От векторных представлений слов к расстояниям между документами // International Conference on Machine Learning. – 2015.
22. Цзен Т. Х., Линь С. Применение обработки естественного языка в индустрии напитков // Journal of Food Engineering. – 2021.
23. Ли Дж., Юн В., Ким С. и др. BioBERT: предобученная биомедицинская языковая модель для майнинга биомедицинских текстов // Bioinformatics. – 2020.
24. Аракэ О., Чжу Г., Иглесиас К. Контентно-ориентированные винные рекомендации на основе глубокого обучения // Decision Support Systems. – 2019.
25. Миллер Г. А. WordNet: лексическая база данных английского языка // Communications of the ACM. – 1995.

   
English version:

AUTOMATION OF BEER PROFILE DESCRIPTION USING NATURAL LANGUAGE PROCESSING AND SENSORY DATA

 

Gulaya Yulia Vasilyevna, Postgraduate, Assist. of the Depart. of Biological and biochemical engineering, Far eastern federal university, Vladivostok, Russia.
Tsygankov Vasily Yuryevich, Dr. of Biol. Sci., Ass. Prof., Pacific institute of geography of the far eastern branch of the Russian Academy of Sciences, Vladivostok, Russia.

 

Keywords: brewing, tasting, neural network, artificial intelligence, NLP, BERT.

 

Abstract. This article presents a scientifically grounded approach to automating the description of beer sensory profiles using modern Natural Language Processing (NLP) methods and the analysis of sensory data obtained from professional tastings. In the context of the growing digitalization of production and marketing processes in the brewing industry, there is an increasing demand for standardized, objective, and reproducible methods for capturing and presenting organoleptic product characteristics. The development of such methods is relevant both for large-scale breweries and small craft beer producers striving for consistent quality and accurate communication of product features to consumers. The aim of this study is to develop an intelligent system based on neural network architectures, in particular the Bidirectional Encoder Representations from Transformers (BERT) model, capable of automatically processing unstructured tasting texts and transforming them into structured descriptions that meet professional standards. The use of pre-trained language models enables the efficient extraction of descriptors, classification of flavor and aroma characteristics, and the generation of textual product profiles suitable for both internal quality control and external marketing purposes. The research details the stages of dataset collection, preprocessing, annotation of key features, formalization of sensory categories, selection of optimal model parameters, and evaluation metrics for text generation quality (such as BLEU, ROUGE, etc.). The tested prototypes demonstrated a high degree of alignment between generated descriptions and expert evaluations, confirmed through both manual and automated assessment. The proposed system can be integrated into corporate information platforms, including ERP and CRM systems used by brewing companies, and applied in scientific or research projects related to the qualitative evaluation of food products. The results confirm the effectiveness of NLP and artificial intelligence technologies in sensory analysis tasks and highlight the prospects for the further application of such approaches in related sectors of the food industry.

   
   For citation: Gulaya, Yu.V., Tsygankov, V. Yu. (2025) Automation of beer profile description using natural language processing and sensory data. Nauchnaya zhizn' [Scientific Life], vol. 20. iss. 3 (141). pp. 744-754 (in Russian) DOI: 10.35679/1991-9476-2025-20-3-744-754 

 

К содержанию»