• Головна
  • Контакты
Понеділок, 20 Квітня, 2026
Нема результатів
View All Result
Daily News
  • Головна
  • Новини
  • Київ
  • Україна
  • Світ
  • Бізнес
  • Політика
  • Спорт
  • IT технології
  • Daily Life
  • Головна
  • Новини
  • Київ
  • Україна
  • Світ
  • Бізнес
  • Політика
  • Спорт
  • IT технології
  • Daily Life
Нема результатів
View All Result
Daily News
Нема результатів
View All Result
Головна Новини від партнерів

Wikimedia зробила дані Вікіпедії зручнішими для штучного інтелекту

1 Жовтня, 2025 / 11:31
в Новини від партнерів
0 0
A A
Share on FacebookShare on Twitter

Wikimedia зробила дані Вікіпедії зручнішими для штучного інтелекту<p>Wikimedia представила проєкт у Німеччині, що дозволяє системам ШІ легше працювати з Вікіпедією та Вікіданими. Завдяки семантичному
пошуку майже 120 мільйонів записів тепер доступні за змістом, а не лише за ключовими словами.</p>

У Німеччині представили новий проєкт, який дозволить системам штучного інтелекту легше працювати з Вікіпедією та Вікіданими. Завдяки семантичному пошуку майже 120 мільйонів записів тепер можна буде знаходити за змістом, а не лише за ключовими словами, пише УНН із посиланням на TechCrunch.

Деталі

“Система під назвою “Проєкт вбудовування Wikidata” застосовує векторний семантичний пошук – техніку, яка допомагає комп’ютерам розуміти значення та зв’язки між словами – до існуючих даних у Вікіпедії та її сестринських платформах, що складаються з майже 120 мільйонів записів”, – пише видання.

Поєднанні з підтримкою нового протоколу контексту моделі (MCP) – стандарту, який дозволяє системам штучного інтелекту ефективніше працювати з джерелами даних, – “проєкт відкриває можливість виконувати запити природною мовою безпосередньо до LLM”. Ініціативу, як вказано, реалізувало німецьке відділення Wikimedia у співпраці з компанією нейронного пошуку Jina.AI та DataStax, що спеціалізується на технологіях обробки даних у режимі реального часу.

Як це працювало раніше

Вікідані роками пропонували машинозчитувані дані з ресурсів Вікімедіа, але попередні інструменти дозволяли лише пошук за ключовими словами та запити SPARQL – спеціалізовану мову запитів. Нова система краще працюватиме із системами доповненого пошуку (RAG), які дозволяють моделям штучного інтелекту отримувати зовнішню інформацію, надаючи розробникам можливість базувати свої моделі на знаннях, перевірених редакторами Вікіпедії.

Дані також структуровані таким чином, щоб забезпечити важливий семантичний контекст. Наприклад, запит до бази даних за словом “вчений” видасть списки видатних вчених-ядерників, а також вчених, які працювали в Bell Labs. Також є переклади слова “вчений” різними мовами, зображення вчених за роботою та осіб, пов’язаних поняттям “дослідник” та “науковець”.

Суть нового проєкту

Новий проєкт з’являється на тлі того, що розробники штучного інтелекту намагаються знайти високоякісні джерела даних, які можна використовувати для точного налаштування моделей. Самі навчальні системи стали складнішими – часто вони збираються як складні навчальні середовища, а не як прості набори даних, але для належного функціонування вони все ще потребують ретельно відібраних даних.

Для систем штучного інтелекту, які вимагають максимальної точності, потреба у перевірених і надійних даних є особливо гострою. І хоча Вікіпедію іноді недооцінюють, її інформація значно більш фактологічно орієнтована, ніж загальні масиви даних на кшталт Common Crawl – величезної збірки вебсторінок з усього інтернету, ідеться у публікації.

Втім, пошук якісних даних може мати високу ціну для лабораторій ШІ. Так, у серпні компанія Anthropic погодилася врегулювати позов групи авторів, чиї твори використовувалися як навчальні матеріали, і виплатити 1,5 мільярда доларів, щоб уникнути подальших претензій.

Керівник проєкту Wikidata AI Філіп Сааде у заяві для преси підкреслив незалежність ініціативи від великих ШІ-лабораторій та технологічних корпорацій.

Запуск цього проєкту Embedding Project показує, що потужний штучний інтелект не обов’язково повинен контролюватися жменькою компаній. Він може бути відкритим, спільним та створеним для обслуговування всіх

– сказав Сааде журналістам.

Источник: УНН

Попередня новина

Ілон Маск вирішив створити свою альтернативу Вікіпедії: xAI вже здійснює розробку

Наступна новина

Нардеп розкрив щомісячний притік до ЗСУ: скільки українців мобілізують в армію

Схожі Новини

“Згадав” пацієнта або як заяви обвинуваченого у медичній недбалості хірурга Odrex Русакова розходяться з оголошеними у суді фактами

“Згадав” пацієнта або як заяви обвинуваченого у медичній недбалості хірурга Odrex Русакова розходяться з оголошеними у суді фактами

20 Квітня, 2026 / 16:30

“Згадав” пацієнта або як заяви обвинуваченого у медичній недбалості хірурга Odrex Русакова розходяться з оголошеними у суді фактами. Віталій Русаков...

У Словенії ліберал Голоб не зміг сформувати уряд, тепер спробує прихильник Трампа – ЗМІ

У Словенії ліберал Голоб не зміг сформувати уряд, тепер спробує прихильник Трампа – ЗМІ

20 Квітня, 2026 / 16:26

У Словенії ліберал Голоб не зміг сформувати уряд, тепер спробує прихильник Трампа - ЗМІ. Партія Свобода переходить в опозицію через...

У Силах оборони спростували інформацію про загрозу "напівоточення" Сум

У Силах оборони спростували інформацію про загрозу "напівоточення" Сум

20 Квітня, 2026 / 16:24

У Силах оборони спростували інформацію про загрозу "напівоточення" Сум. Сили оборони заперечують загрозу оточення міста та контролюють ситуацію. Окупанти зайняли...

Наступна новина

Нардеп розкрив щомісячний притік до ЗСУ: скільки українців мобілізують в армію

ГОЛОВНЕ СЬОГОДНІ

  • Повторна атака дронів на Харків – поранено двоє людей

    Повторна атака дронів на Харків – поранено двоє людей

    0 поширити
    Share 0 Tweet 0
  • Японія оголосила загрозу цунамі через потужний землетрус

    0 поширити
    Share 0 Tweet 0
  • Ворог атакував Харків дронами – перші подробиці

    0 поширити
    Share 0 Tweet 0

ОСТАННІ НОВИНИ

Новини від партнерів

“Згадав” пацієнта або як заяви обвинуваченого у медичній недбалості хірурга Odrex Русакова розходяться з оголошеними у суді фактами

5 хвилин тому
Новини від партнерів

У Словенії ліберал Голоб не зміг сформувати уряд, тепер спробує прихильник Трампа – ЗМІ

9 хвилин тому
Новини від партнерів

У Силах оборони спростували інформацію про загрозу "напівоточення" Сум

11 хвилин тому
Новини від партнерів

Брюссель наполягає на відсутності дефіциту авіапалива в ЄС

21 хвилина тому
Новини від партнерів

На Черкащині викрили схему незаконного видобутку піску з Дніпра на 750 млн грн

37 хвилин тому
Новини від партнерів

Застаріла методологія й нові ціни — чому споживчий кошик в Україні треба змінювати та яким він має бути

39 хвилин тому
Новини від партнерів

Поблизу Рівного стався вибух, є постраждалі

44 хвилини тому
Новини від партнерів

Шахраї розсилають фейкові листи від Буданова, інформацію про кібершахрайство передали правоохоронцям – ОП

54 хвилини тому
Показати ще

Ми на Facebook

  • Головна
  • Публікації
  • Контакты
RSS

© 2015 - 2026 Daily.com.ua - щоденні новини України | Підтримка сайту Webdesigner.com.ua

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Нема результатів
View All Result
  • Головна
  • Новини
  • Київ
  • Україна
  • Світ
  • Бізнес
  • Політика
  • Спорт
  • IT технології
  • Daily Life

© 2015 - 2026 Daily.com.ua - щоденні новини України | Підтримка сайту Webdesigner.com.ua