• За нас
  • Пишете ни!
петък, 12 юни, 2026
Няма резултати
Виж всички резултати
Epoch Times Bulgaria
  • България
  • Европа
  • САЩ
  • Русия
  • Китай
  • Свят
  • Култура
  • Наука
  • Дух и съзнание
  • Начин на живот
Epoch Times Bulgaria
Няма резултати
Виж всички резултати
Начало Наука и технологии

Проучване установи, че съдържание на китайски държавни медии е включено в данните за обучение на изкуствен интелект

отМайкъл Джуан
26 май , 2026
Проучване установи, че съдържание на китайски държавни медии е вградено в данните за обучение на ИИ

Про-демократичен протестиращ използва лаптоп, седнал на блокиран път в квартал Адмиралтейство в Хонконг в ранните часове на 8 октомври 2014 г. Ед Джоунс/AFP чрез Getty Images

Проучване на Nature установи, че китайски държавни медии са широко включени в наборите от данни за обучение на ИИ и може да влияят върху начина, по който моделите отговарят на чувствителни политически въпроси

Ново изследване показва, че съдържанието от китайски държавни медии е дълбоко вградено в наборите от данни, използвани за обучение на водещи системи за изкуствен интелект (ИИ). Това може да влияе върху начина, по който някои модели отговарят на политически чувствителни въпроси.

Проучването, публикувано в научното списание Nature на 13 май, установи, че в наборите от данни за обучение на големи езикови модели се съдържат значителни количества материали от китайски държавни издания, сред които Синхуа и „Жънмин жибао“.

Според изследването, когато получават запитвания на китайски език по теми, свързани с политическата система на Китай или чувствителни вътрешни въпроси, няколко водещи ИИ системи – включително ChatGPT, Claude и Gemini – по-често генерират отговори, съответстващи на официалната позиция на китайския режим. Отговорите на същите въпроси на английски език, според проучването, нерядко се различават по тон или разстановка на акцентите.

Изследователите подчертаха, че не са открили доказателства за хакване или пряка манипулация на ИИ системи. Вместо това те твърдят, че ефектът вероятно се дължи на структурата на самите данни, използвани за обучение.

Китайските държавни медии публикуват огромни количества свободно достъпно, широко разпространено и унифицирано форматирано съдържание. То се събира по-лесно от уеб роботите, използвани в процесите за обучение на ИИ. За разлика от тях, независимите новинарски организации по-често работят зад платена стена, прилагат ограничения за авторски права или блокират автоматизираното събиране на данни – което ограничава присъствието им в обучителните набори.

Тази асиметрия, според проучването, може неволно да осигури по-голямо присъствие на държавно ориентираните наративи в системите за машинно обучение, разчитащи на данни от отворения интернет.

Как обучителните данни могат да оформят поведението на модела

Изследователи, анализирали голям набор от данни с отворен код на китайски език, известен като CulturaX, установиха, че той съдържа около 189 милиона документа. В рамките на този набор съдържанието от китайски държавни медии е представено в мащаб, далеч надхвърлящ обема на китайскоезичната Уикипедия.

Анализът установи също, че в политически натоварени контексти – включително препратки към Китайската комунистическа партия или китайското ръководство – съдържанието на държавните медии представлява значителен дял от релевантния материал в набора от данни.

Когато изследователите тестваха множество ИИ модели със сравними запитвания на китайски и английски език, те отчетоха забележими разлики. В някои случаи отговорите на китайски по-често включваха официална терминология или отразяваха наративи, широко използвани в политическия дискурс на Пекин. Английските отговори, за разлика от тях, като цяло бяха по-неутрални или по-разнообразни по формулировка.

За разлика от традиционните медийни канали – като телевизия или вестници – ИИ системите генерират синтезирани отговори, които могат да изглеждат неутрални, дори когато отразяват модели, вградени в обучителните данни.

Проучването разширява анализа си до десетки страни и предполага наличието на по-широка закономерност: в среди с по-ниска свобода на печата резултатите от ИИ системи, обучени на местноезикови данни, по-често отразяват държавно ориентирани формулировки.

Сун Чен участва в изготвянето на този материал. 

Споделете тази статия

Вашият коментар Отказ

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Последвайте ни във Фейсбук

НАЙ-ТЪРСЕНИ ДНЕС

Ароматни пилешки бутчета на фурна с печени картофи и аспержи

Вкусни пилешки бутчета на фурна с печени картофи и аспержи

0
0
Пържено пиле без угризения: Пиле с хрупкава коричка от бадемово брашно, лимон, чесън и билки

Пържено пиле без угризения: Хрупкаво пиле с коричка от бадемово брашно, лимон, чесън и билки

0
0
Рецепта за сладоледени сандвичи

Рецепта за сладоледен сандвич

0
0
Мента — градинското билче за бистър ум

Мента – градинската билка за бистър ум и чисто съзнание

0
0
Селска агнешка чорба на баба

Селска агнешка чорба с ориз

0
0
Основателят на Фалун Гонг  г-н Ли Хонгджъ говори в DAR Constitution Hall във Вашингтон, окръг Колумбия. (Марк Зоу/Epoch Times)

Основателят на Фалун Гонг: COVID-19 се цели в поддръжниците на ККП

0
0
Доходното здание в Русе – един архитектурен шедьовър от началото на ХХ век

„Ето ви една идея!“

0
0

Свързани Публикации

Най-важният експеримент с изкуствен интелект, за който никога не сте чували

Най-важният AI експеримент, за който никога не сте чували

0
0
НАСА отмени заповедта за евакуация на астронавтите на борда на космическата станция

НАСА отмени заповедта за евакуация на астронавтите на борда на Космическата станция

0
0
Google търси федерално одобрение за пускането на милиони комари в Калифорния и Флорида

Google търси федерално одобрение за пускането на милиони комари в Калифорния и Флорида

0
0
Защо захарта те успокоява, но натоварва тялото ти

Защо захарта те успокоява, но всъщност натоварва тялото ти повече

0
0
Учени измериха количеството микропластмаси в кафе, сервирано в чаши за вземане. Ето какво установиха.

Учените измериха количеството микропластмаси в кафето, сервирано в чаши за вкъщи – ето какво са открили

0
0
Ирански футболисти на Световното първенство могат да влязат в САЩ деня преди мачовете: Министерство на вътрешната сигурност

Ирански футболисти на Световното първенство ще могат да влязат в САЩ в деня преди мачовете

0
0
Хосе Кура

Хосе Кура към младите: „Бъдете себе си“

0
0
Най-важният експеримент с изкуствен интелект, за който никога не сте чували

Най-важният AI експеримент, за който никога не сте чували

0
0
id6046167 gettyimages 2280208086 vs 22

Денят в снимки: тайвански учения с боеприпаси, изслушването за връзките на Бил Гейтс с Епстийн и присъдата за нападението с киселина от индонезийската армия

0
0
Китай краде технологии за изкуствен интелект, които не може да разработи сам, твърди компания за киберсигурност

Китай краде технологии за изкуствен интелект, които не може да разработи самостоятелно

0
0
Следваща публикация
Ситуацията с хантавируса е стабилна, заяви директорът на СЗО

Ситуацията с хантавируса е стабилна, заяви шефът на СЗО

Epoch Times лого
Facebook X-twitter Goodreads-g Youtube Instagram Telegram
  • Последни новини
  • Направете дарение

35 страни, 21 езика

  • English
  • 中文
  • Español
  • עברית
  • 日本語
  • 한국어
  • Bahasa Indonesia
  • Français
  • Deutsch
  • Italiano
  • Português
  • Svenska
  • Nederlands
  • Русский
  • Українська
  • Română
  • Česky
  • Slovenščina
  • Polski
  • Türkçe
  • فارسی
  • За нас
  • Авторски права
  • Условия за ползване
  • Пишете ни!
  • Поверителност на информацията
  • България
  • Свят
  • Китай
    • COVID-19 и Ваксинация
  • Култура и изкуство
  • Наука и технологии
  • Начин на живот
  • Мнения
  • За нас
  • Авторски права
  • Условия за ползване
  • Пишете ни!
  • Поверителност на информацията
Copyright © 2024 Epochtimes.bg | Всички права запазени Epochtimes.bg не носи отговорност за съдържанието на външни сайтове | Divinitum – дигитален маркетинг партньор.
Няма резултати
Виж всички резултати
  • България
  • Европа
  • САЩ
  • Русия
  • Китай
  • Свят
  • Култура
  • Наука
  • Дух и съзнание
  • Начин на живот

© 2019 Epoch Times България.

Epoch Times Bulgaria