| Рубрика: | ЭКОНОМИЧЕСКАЯ И ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ |
| Коды JEL: | O31, O33 |
| DOI: | 10.35679/2226-0226-2025-15-10-1349-1359 |
| Для цитирования: |
Унижаев Н. В. Методы нарушения конфиденциальности больших языковых моделей // Научное обозрение: теория и практика. 2025. Т. 15. Вып. 10 (122). С. 1349-1359. DOI: 10.35679/2226-0226-2025-15-10-1349-1359 |
| Авторы: |
Унижаев Николай Владимирович, канд. техн. наук, профессор кафедры «Безопасность и информационные технологии», ФГБОУ ВО «Национальный исследовательский университет «МЭИ»: Россия, 111250, г. Москва, ул. Красноказарменная, 14, стр. 1.
Тел.: (495) 362-72-86 |
| Аннотация: |
Статья посвящена анализу методов нарушения конфиденциальности больших языковых моделей. Нейросети работая с различными массивами данных получают доступ к сведениям конфиденциального характера, в том числе и к множественным персональным данным. Волнения вызванные качеством сохранности такой информации обоснованы. Отказаться от предоставления нейросетям конфиденциальной информации означает отказаться от прогресса и всех преимуществ нейросетей. Целью исследования стало выявление угроз и поиск методов нарушения конфиденциальности больших языковых моделей. Для достижения цели в рамках исследования была разработана математическая модель угроз конфиденциальной информации в больших языковых моделях. Модель, используя обучающий набор данных и запросы данных связывает все процессы атак. В такой постановке модель позволяет выявить порог вероятности раскрытия конфиденциальной информации, что в свою очередь помогает принимать правильные решения. При апробации модели были получены результаты показывающие уязвимости практически от всех угроз. В эксперименте были исследованы все современные Российские и зарубежные LLM-модели. Проведенное исследование выявило еще одну проблему: отсутствие стандартов и регламентирующих документов, обеспечивающих оценку конфиденциальности LLM-моделей. Данная проблема требует отдельного исследования и решения. Без таких стандартов и регламентов LLM-модели не могут быть сертифицированы в соответствие с международными и российскими требованиями к сложным техническим системам. |
| Ключевые слова: |
LLM-модели, искусственный интеллект, нейросети, GPT, безопасность информационных технологий, цифровая экономика, автоматизация бизнес-процессов, угрозы |
| Список литературы: |
1. Указ Президента РФ от 02.07.2021 N 400 «О Стратегии национальной безопасности Российской Федерации» URL-http://www.consultant.ru/ (дата обращения: 10.12.2025). |
| English version: |
METHODS FOR VIOLATING THE PRIVACY OF LARGE LANGUAGE MODELS
Unizhayev Nikolay Vladimirovich, Cand. of Tech. Sci., Prof. of the Depart. of Security and information technology, National research university "MPEI", Moscow, Russia. Keywords: LLM models, artificial intelligence, neural networks, GPT, information technology security, digital economy, business process automation, threats.
Abstract. This article analyzes methods for compromising the confidentiality of large language models. Neural networks, when working with various data sets, gain access to sensitive information, including multiple personal data. Concerns about the security of such information are justified. Refusing to provide neural networks with sensitive information means forgoing progress and all the advantages of neural networks. The goal of the study was to identify threats and find methods for compromising the confidentiality of large language models. To achieve this goal, a mathematical model of threats to confidential information in large language models was developed. Using a training dataset and data queries, the model links all attack processes. In this formulation, the model allows one to identify the threshold for the likelihood of disclosing confidential information, which in turn helps make the right decisions. Testing the model yielded results showing vulnerabilities to virtually all threats. The experiment examined all modern Russian and international LLM models. The study revealed another problem: the lack of standards and regulations for assessing the confidentiality of LLM models. This issue requires separate research and resolution. Without such standards and regulations, LLM models cannot be certified in accordance with international and Russian requirements for complex technical systems. |
| For citation: |
Unizhayev, N.V. (2025) Methods for violating the privacy of large language models. Nauсnoe obozrenie: teoria i praktika [Scientific Review: Theory and Practice], vol. 15, iss. 10 (122), pp. 1349-1359 (in Russian) DOI: 10.35679/2226-0226-2025-15-10-1349-1359 |