• За нас
  • Пишете ни!
вторник, 26 май, 2026
Няма резултати
Виж всички резултати
Epoch Times Bulgaria
  • България
  • Европа
  • САЩ
  • Русия
  • Китай
  • Свят
  • Култура
  • Наука
  • Дух и съзнание
  • Начин на живот
Epoch Times Bulgaria
Няма резултати
Виж всички резултати
Начало Наука и технологии

Проучване установи, че съдържание на китайски държавни медии е включено в данните за обучение на изкуствен интелект

отМайкъл Джуан
26 май , 2026
Проучване установи, че съдържание на китайски държавни медии е вградено в данните за обучение на ИИ

Про-демократичен протестиращ използва лаптоп, седнал на блокиран път в квартал Адмиралтейство в Хонконг в ранните часове на 8 октомври 2014 г. Ед Джоунс/AFP чрез Getty Images

Проучване на Nature установи, че китайски държавни медии са широко включени в наборите от данни за обучение на ИИ и може да влияят върху начина, по който моделите отговарят на чувствителни политически въпроси

Ново изследване показва, че съдържанието от китайски държавни медии е дълбоко вградено в наборите от данни, използвани за обучение на водещи системи за изкуствен интелект (ИИ). Това може да влияе върху начина, по който някои модели отговарят на политически чувствителни въпроси.

Проучването, публикувано в научното списание Nature на 13 май, установи, че в наборите от данни за обучение на големи езикови модели се съдържат значителни количества материали от китайски държавни издания, сред които Синхуа и „Жънмин жибао“.

Според изследването, когато получават запитвания на китайски език по теми, свързани с политическата система на Китай или чувствителни вътрешни въпроси, няколко водещи ИИ системи – включително ChatGPT, Claude и Gemini – по-често генерират отговори, съответстващи на официалната позиция на китайския режим. Отговорите на същите въпроси на английски език, според проучването, нерядко се различават по тон или разстановка на акцентите.

Изследователите подчертаха, че не са открили доказателства за хакване или пряка манипулация на ИИ системи. Вместо това те твърдят, че ефектът вероятно се дължи на структурата на самите данни, използвани за обучение.

Китайските държавни медии публикуват огромни количества свободно достъпно, широко разпространено и унифицирано форматирано съдържание. То се събира по-лесно от уеб роботите, използвани в процесите за обучение на ИИ. За разлика от тях, независимите новинарски организации по-често работят зад платена стена, прилагат ограничения за авторски права или блокират автоматизираното събиране на данни – което ограничава присъствието им в обучителните набори.

Тази асиметрия, според проучването, може неволно да осигури по-голямо присъствие на държавно ориентираните наративи в системите за машинно обучение, разчитащи на данни от отворения интернет.

Как обучителните данни могат да оформят поведението на модела

Изследователи, анализирали голям набор от данни с отворен код на китайски език, известен като CulturaX, установиха, че той съдържа около 189 милиона документа. В рамките на този набор съдържанието от китайски държавни медии е представено в мащаб, далеч надхвърлящ обема на китайскоезичната Уикипедия.

Анализът установи също, че в политически натоварени контексти – включително препратки към Китайската комунистическа партия или китайското ръководство – съдържанието на държавните медии представлява значителен дял от релевантния материал в набора от данни.

Когато изследователите тестваха множество ИИ модели със сравними запитвания на китайски и английски език, те отчетоха забележими разлики. В някои случаи отговорите на китайски по-често включваха официална терминология или отразяваха наративи, широко използвани в политическия дискурс на Пекин. Английските отговори, за разлика от тях, като цяло бяха по-неутрални или по-разнообразни по формулировка.

За разлика от традиционните медийни канали – като телевизия или вестници – ИИ системите генерират синтезирани отговори, които могат да изглеждат неутрални, дори когато отразяват модели, вградени в обучителните данни.

Проучването разширява анализа си до десетки страни и предполага наличието на по-широка закономерност: в среди с по-ниска свобода на печата резултатите от ИИ системи, обучени на местноезикови данни, по-често отразяват държавно ориентирани формулировки.

Сун Чен участва в изготвянето на този материал. 

Споделете тази статия

Вашият коментар Отказ

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Последвайте ни във Фейсбук

НАЙ-ТЪРСЕНИ ДНЕС

Домашно песто

Домашно песто

0
0
Свинско пармиджано със спагети и пикантна рукола

Свинско с пармезан, спагети и рукола с пикантен привкус

0
0
09bad71d 19b7 4947 9781 1cf98068ba56

„101 далматинци“ оживяват на сцената в Стара Загора

0
0
Селска агнешка чорба на баба

Селска агнешка чорба с ориз

0
0
Снимка: flashlight.bg

Ароматен сироп от бял бъз без варене

0
2
c0e38ea5 b61d 47ac a071 3f8f9f260963

Огнян Стамболиев: Живея заради добрата литература и художествената музика…

0
0
Рапърът Роб Бейс, познат с хита „It Takes Two", почина на 59-годишна възраст

Рапърът Роб Бейс, известен с хита „It Takes Two“, почина на 59-годишна възраст

0
0

Свързани Публикации

Съдържанието, генерирано от ИИ, залива интернет — как се отразява това на критичното мислене

Съдържанието, генерирано от ИИ, залива интернет – как се отразява това на критичното мислене

0
0
c1f65b21 1041 4eda 9edc 2cbf727a5228

Децата срещу екраните: „Бих направил затвор за телефони“

0
0
Tesla пусна функцията за напълно самостоятелно шофиране в Литва

Tesla пусна функцията за напълно самостоятелно шофиране в Литва

0
0
Ако ви откраднат телефона, престъпниците могат да източат банковата ви сметка за минути

Ако ви откраднат телефона, престъпниците могат да източат банковата ви сметка за минути

0
0
Съкращаваме си живота по хиляди начини – но може би има начин да обърнем процеса

Съкращаваме си живота по хиляди начини – но може би има как да обърнем процеса

0
0
Кои задачи по поддръжката на двора най-често се пренебрегват?

Кои задачи по поддръжката на двора най-често се пренебрегват?

0
0
Рапърът Роб Бейс, познат с хита „It Takes Two", почина на 59-годишна възраст

Рапърът Роб Бейс, известен с хита „It Takes Two“, почина на 59-годишна възраст

0
0
Бритни Спиърс се държала „конфронтационно" и „екстравагантно", но тестът й за алкохол показал ниски стойности по време на проверката й за пияно шофиране

Бритни Спиърс се държала „провокативно“ и „необуздано“, но при проверката за шофиране в нетрезво състояние резултатът за алкохол бил с ниски стойности

0
0
Как доброто облекло на работното място може да промени живота ви

Силата на добрия външен вид на работното място, която променя живота

0
0
Защо мъжете имат нужда от спорт

Защо мъжете имат нужда от спорт?

0
0
Epoch Times лого
Facebook X-twitter Goodreads-g Youtube Instagram Telegram
  • Последни новини
  • Направете дарение

35 страни, 21 езика

  • English
  • 中文
  • Español
  • עברית
  • 日本語
  • 한국어
  • Bahasa Indonesia
  • Français
  • Deutsch
  • Italiano
  • Português
  • Svenska
  • Nederlands
  • Русский
  • Українська
  • Română
  • Česky
  • Slovenščina
  • Polski
  • Türkçe
  • فارسی
  • За нас
  • Авторски права
  • Условия за ползване
  • Пишете ни!
  • Поверителност на информацията
  • България
  • Свят
  • Китай
    • COVID-19 и Ваксинация
  • Култура и изкуство
  • Наука и технологии
  • Начин на живот
  • Мнения
  • За нас
  • Авторски права
  • Условия за ползване
  • Пишете ни!
  • Поверителност на информацията
Copyright © 2024 Epochtimes.bg | Всички права запазени Epochtimes.bg не носи отговорност за съдържанието на външни сайтове | Divinitum – дигитален маркетинг партньор.
Няма резултати
Виж всички резултати
  • България
  • Европа
  • САЩ
  • Русия
  • Китай
  • Свят
  • Култура
  • Наука
  • Дух и съзнание
  • Начин на живот

© 2019 Epoch Times България.

Epoch Times Bulgaria