Українські айтішники створили WEB3-бібліотеку для контекстного перекладу та відновлення документів із допомогою ШІ

21.06.2023 0 By Writer.NS

Українські інженери створили WEB3-бібліотеку для контекстного перекладу та відновлення документів з допомогою ШІ. Як працює стартап Lobula, пише dev.ua.

Ілюстративне фото

За словами СЕО та засновника стартапу Артема Харитоненка, мета проєкту — змінити культуру і науку України. «Ринок наукової та художньої літератури в Україні надзвичайно малий, що призводить до використання російських і радянських видань, ненадійних джерел і неякісних перекладів. Причиною цього є повільний розвиток перекладацької та видавничої справи, який поглиблюється з розширенням проблеми. Сьогодні ринок української літератури сягає лише $100 млн, але він здатний збільшити свій обсяг у кілька разів. Проблеми розширення — мала кількість перекладених творів, їх вартість та обсяг», — розповів він dev.ua.

Автори lobula створили унікальну та комплексну модель, яка дозволить не лише перекладати тексти будь-якої складності на рівні, що перевищує професійні перекладачі., а також для відновлення оригінальних документів, зображень, графіки, діаграм та всього, що необхідно.

Розробники створили алгоритм, який чітко заточений під конкретний вид текстів, що результує у дуже високій якості перекладу. «Це відбувається завдяки великому корпусу української мови та інших мов. Не менш значущою є якість відтворення оригінальних діаграм, малюнків, зображень тощо. Також Lobula розробляє метод децентралізованого зберігання даних, що пришвидшить роботу системи для клієнтів та надасть можливість поширити використання ШІ на інші сервіси та послуги», — пояснює СЕО стартапу.

Він наголошує: широкість перекладів (а це саме 70 000 робіт на початку, що вдвічі більше за обсяги найбільших гравців на цьому ринку) і їхня незначна вартість, яка не визначається амортизацією за довгий переклад — головні переваги Lobula на ринку України.

Орієнтований проєкт як на науково-освітні установи та користувачів цих категорій, так і на звичайних людей, що мають проблему у тому, щоб знайти український переклад необхідного твору.

«Зовсім скоро проєкт виходить на стадію MVP. Ми шукаємо джерела фінансування та поширення по Україні та світові. Ведуться переговори з AngelOneFund про залучення $150 000 інвестицій», — каже Артем.

Сервіс створений на основі ШІ, який наразі в розробці. «Корпуси мови ми об’єднуємо і компілюємо власноруч. Також виходимо на контакт з дослідниками, наприклад з Dimitrios Roussis та Vassilis Papavassiliou, що створили Англійсько-Український корпус мов», — каже Харитоненко.

Щодо авторських прав, то наразі розробники мають базу даних близько 100 000 класичних робіт та наукових видань, які не є власністю видавництв — через проєкт Gutenberg, або ж не монетизують їх — DOAJ, JSTOR тощо.

«Саме корпуси мов, що наразі існують, не є досить об’ємними, тож в планах є залучення анотаторів даних для створення власної бази», — каже Артем.

Наразі у проєкті чотири людини. Всі є українцями. Але команда розширюється, і наразі проєкт шукає ще близько чотирьох розробників та до 10 людей на інші напрями (маркетинг, веб тощо).

Читайте також на Newssky «Макрон повідомив про розгортання в Україні системи SAMP/T» і дивіться на YouTube-каналі «Нудний Пенс».

Щоб завжди бути в курсі подій, підписуйтесь на ТГ-канал Newssky. Також рекомендуємо актуальні дискусії друзів України в Північній Америці на YouTube-каналі Rashkin Report.


Підтримати проект:

Підписатись на новини:




В тему: