НАУКА ОБРАЗОВАНИЯ - издательский дом

Switch to desktop

Материалы

МЕТОДЫ НАРУШЕНИЯ КОНФИДЕНЦИАЛЬНОСТИ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ

 

Журнал «НАУЧНОЕ ОБОЗРЕНИЕ: ТЕОРИЯ И ПРАКТИКА»  [СКАЧАТЬ СТАТЬЮ В PDF]
ТОМ 15, ВЫПУСК 10, 2025

Рубрика: ЭКОНОМИЧЕСКАЯ И ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ
Коды JEL: O31, O33
DOI: 10.35679/2226-0226-2025-15-10-1349-1359
   
Для цитирования:

Унижаев Н. В. Методы нарушения конфиденциальности больших языковых моделей // Научное обозрение: теория и практика. 2025. Т. 15. Вып. 10 (122). С. 1349-1359. DOI: 10.35679/2226-0226-2025-15-10-1349-1359

   
Авторы: 

Унижаев Николай Владимирович, канд. техн. наук, профессор кафедры «Безопасность и информационные технологии», ФГБОУ ВО «Национальный исследовательский университет «МЭИ»: Россия, 111250, г. Москва, ул. Красноказарменная, 14, стр. 1.

 

Тел.: (495) 362-72-86
E-mail: UnizhayevNV@mpei.ru

   
Аннотация: 

Статья посвящена анализу методов нарушения конфиденциальности больших языковых моделей. Нейросети работая с различными массивами данных получают доступ к сведениям конфиденциального характера, в том числе и к множественным персональным данным. Волнения вызванные качеством сохранности такой информации обоснованы. Отказаться от предоставления нейросетям конфиденциальной информации означает отказаться от прогресса и всех преимуществ нейросетей. Целью исследования стало выявление угроз и поиск методов нарушения конфиденциальности больших языковых моделей. Для достижения цели в рамках исследования была разработана математическая модель угроз конфиденциальной информации в больших языковых моделях. Модель, используя обучающий набор данных и запросы данных связывает все процессы атак. В такой постановке модель позволяет выявить порог вероятности раскрытия конфиденциальной информации, что в свою очередь помогает принимать правильные решения. При апробации модели были получены результаты показывающие уязвимости практически от всех угроз. В эксперименте были исследованы все современные Российские и зарубежные LLM-модели. Проведенное исследование выявило еще одну проблему: отсутствие стандартов и регламентирующих документов, обеспечивающих оценку конфиденциальности LLM-моделей. Данная проблема требует отдельного исследования и решения. Без таких стандартов и регламентов LLM-модели не могут быть сертифицированы в соответствие с международными и российскими требованиями к сложным техническим системам.

   
Ключевые слова:

LLM-модели, искусственный интеллект, нейросети, GPT, безопасность информационных технологий, цифровая экономика, автоматизация бизнес-процессов, угрозы

   
Список литературы:

1. Указ Президента РФ от 02.07.2021 N 400 «О Стратегии национальной безопасности Российской Федерации» URL-http://www.consultant.ru/ (дата обращения: 10.12.2025).
2. Артамонова Е.В., Милаков А.С. Проблемы обеспечения безопасности нейросетей глубокого машинного обучения от бэкдор-атак // Защита информации. Инсайд. 2024. № 2 (116). С. 26-32.
3. Беляева Т.А., Микрюков А.А. Нейросетевое прогнозирование инцидентов информационной безопасности // Международный студенческий научный вестник. 2023. № 6. С. 30
4. Бродская Н.П. Большие языковые модели: генеративные модели ИИ как инструмент влияния в социальном пространстве современного общества // Вопросы политологии. 2023. Т. 13. № 10-1 (98-1). С. 5018-5029.
5. Вакушин А.А., Клебанов Б.И. Проектирование многокомпонентных имитационных моделей с помощью большой языковой модели GPT-4 // Инженерный вестник Дона. 2024. № 7 (115). С. 174-186.
6. Галушкин А. И. Нейронные сети // Большая российская энциклопедия: [в 35 т.] / гл. ред. Ю. С. Осипов. — М.: Большая российская энциклопедия, 2004—2017.
7. Голубов Н.А., Косов Н.А. Обнаружение инсайдерской угрозы с помощью глубинной нейросети //Интернаука. 2023. № 1-1 (271). С. 37-39.
8. Горбан А.Н.. Нейроинформатика // Новосибирск: Сибирское научное издательство, 2008. — С. 7–9.
9. Демидов Р.А., Зегжда П.Д., Калинин М.О. Анализ угроз кибербезопасности в динамических сетях передачи данных с применением гибридной нейросетевой модели // Проблемы информационной безопасности. Компьютерные системы. 2018. № 2. С. 27-33.
10. Малолетко А.Н., Чичканов П.С. Влияние чат-ботов с искусственным интеллектом на экономическую безопасность объектов электронной торговли // OpenScience. 2023. Т. 5. № 1. С. 135-146.
11. Петренко А.С., Петренко С.А., Ожиганова М.И. О киберустойчивости и безопасности изобразительных нейросетей // Защита информации. Инсайд. 2023. № 6 (114). С. 50-54.
12. Петров А.В. Противодействие угрозам, порождаемым стремительным развитием нейросетей, с целью защиты национальных экономических интересов России // Актуальные вопросы современной экономики. 2024. № 5. С. 475-484.
13. Портал GigaChat (Сбер) // URL- https://giga.chat/gigachat/ (дата обращения: 12.12.2025).
14. Портал IBM, статья. Что такое нейронная сеть? // URL-https://www.ibm.com/docs/ru/ (дата обращения: 15.12.2025).
15. Сачков И.К., Назаров А.Н. Автоматизация противодействия бот-атакам // T-Comm: Телекоммуникации и транспорт. 2014. Т. 8. № 6. С. 5-9.
16. Сбоев А.Е. Исследование больших языковых моделей и возможностей их применения для решения бизнес-задач // Инженерные кадры - будущее инновационной экономики России. 2024. № 1. С. 1568-1572.
17. Тетеревенков Д.Л. Экспертно-ориентированные методы оценки качества текстовой генерации больших языковых моделей // Мягкие измерения и вычисления. 2025. Т. 90. № 5. С. 30-37.
18. Унижаев Н.В. Анализ угроз от нейросетей // Конференция. Цифровая трансформация: тенденции и перспективы. Материалы III Международной научно-практической конференции. - М.: "Мир науки", 2024. - С. 600-617.
19. Унижаев Н.В. Использование цифрового рубля для обеспечения экономической безопасности гражданина, организации, государства // Экономика и предпринимательство. 2024. № 1 (162). С. 202-208.
20. Унижаев Н.В. Моделирование угроз малому и среднему бизнесу от использования параллельного импорта // Вестник Алтайской академии экономики и права. – 2022. – № 11 (часть 3) – С. 563-568; URL: https://vaael.ru/ (дата обращения: 19.12.2025).
21. Федотова Е.В. Генерация с дополненным поиском для больших языковых моделей // Форум. 2024. № 21-2 (275). С. 50-54.
22. Шедько Ю.Н., Унижаев Н.В., Власенко М.Н. Анализ учета правового режима при использовании цифровых двойников в системах управления экономической безопасностью организации // Вопросы российского и международного права. 2024. Т. 14. № 10-1. С. 188-200.
23. Tatarinov V.V., Unizhaev N.V. Model for the formation of the requirements for information technology used in the digital economy ecosystem // В сборнике: AIP Conference Proceedings. International Scientific and Practical Conference «Modeling in Education 2019». 2019. С. 020059.
24. Shedko Y. N., Baronov O. R, Unizhaev N.V. Problems of digital transformation of energy companies // Conference Proceedings: Managerial Sciences in the Modern World. 2022, EurAsian Scientific Editions SA, Geneva, Switzerland /EurAsian Scientific Editions Ltd, Hong Kong

   
English version:

METHODS FOR VIOLATING THE PRIVACY OF LARGE LANGUAGE MODELS

 

Unizhayev Nikolay Vladimirovich, Cand. of Tech. Sci., Prof. of the Depart. of Security and information technology, National research university "MPEI", Moscow, Russia.

 

Keywords: LLM models, artificial intelligence, neural networks, GPT, information technology security, digital economy, business process automation, threats.

 

Abstract. This article analyzes methods for compromising the confidentiality of large language models. Neural networks, when working with various data sets, gain access to sensitive information, including multiple personal data. Concerns about the security of such information are justified. Refusing to provide neural networks with sensitive information means forgoing progress and all the advantages of neural networks. The goal of the study was to identify threats and find methods for compromising the confidentiality of large language models. To achieve this goal, a mathematical model of threats to confidential information in large language models was developed. Using a training dataset and data queries, the model links all attack processes. In this formulation, the model allows one to identify the threshold for the likelihood of disclosing confidential information, which in turn helps make the right decisions. Testing the model yielded results showing vulnerabilities to virtually all threats. The experiment examined all modern Russian and international LLM models. The study revealed another problem: the lack of standards and regulations for assessing the confidentiality of LLM models. This issue requires separate research and resolution. Without such standards and regulations, LLM models cannot be certified in accordance with international and Russian requirements for complex technical systems.

   
 For citation:

Unizhayev, N.V. (2025) Methods for violating the privacy of large language models. Nauсnoe obozrenie: teoria i praktika [Scientific Review: Theory and Practice], vol. 15, iss. 10 (122), pp. 1349-1359 (in Russian) DOI: 10.35679/2226-0226-2025-15-10-1349-1359

 

К содержанию»