Основен Иновация Google AI сега позволява на потребителите незабавно да превеждат текст на 27 езика с телефонни камери

Google AI сега позволява на потребителите незабавно да превеждат текст на 27 езика с телефонни камери

(Gif: Google)

(Gif: Google)



Благодарение на изкуствения интелект пътуванията в чужбина никога не са били по-прости.

Приложението Google Translate позволява на потребителите да превеждат текст незабавно. В приложението просто насочете камерата към текста, който искате да преведете, и ще видите, че той се трансформира в желания от вас език на живо, точно пред очите ви - не са необходими интернет връзка или данни за мобилен телефон. Тази удобна функция е достъпна от известно време, но е била съвместима само със седем езика. Сега , благодарение на машинното обучение, Google надгради приложението, за да преведе незабавно 27 езика.

Така че следващия път, когато сте в Прага и не можете да прочетете меню, ние сме ви върнали, Отавио Гуд, софтуерен инженер в Google, написа в проучването на компанията Блог .

Google също така използва AI, за да намали наполовина техните грешки при разпознаване на реч.

От днес, в допълнение към превода между английски, френски, немски, италиански, португалски, руски и испански, могат да се превеждат и следните 20 езика в реално време: български, каталунски, хърватски, чешки, датски, холандски, филипински, Финландски, унгарски, индонезийски, литовски, норвежки, полски, румънски, словашки, шведски, турски и украински. И ако решите да щракнете снимка, вместо да гледате превода на текст на живо, се поддържат общо 37 езика.

И така, как Google успя да увеличи броя на наличните езици? За първи път те придобиха Word Lens, по-рано приложение за превод на добавена реалност, и използваха машинно обучение и конволюционни невронни мрежи, за да подобрят възможностите на приложението. Напредъкът в разпознаването на изображения беше ключов.

Преди пет години, ако сте дали на компютър изображение на котка или куче, той е имал проблеми да разбере кое кое. Благодарение на конволюционните невронни мрежи, компютрите не само могат да различат котките и кучетата, но дори могат да разпознават различни породи кучета, каза г-н Гуд. Да, те са добри не само трипи изкуство —Ако превеждате чуждо меню или се подписвате с най-новата версия на приложението Google Translate, сега използвате дълбока невронна мрежа.

Стъпка по стъпка

Първо , Преводачът трябва да премахне задръстванията на фона и да намери текста. Когато локализира петна от един и същи цвят, той определя, че това са букви. И когато тези петна са близо един до друг, разбира, че трябва да се чете непрекъснат ред.

Следващия, приложението трябва да разпознава каква е всяка отделна буква. Тук идва дълбокото обучение.

Използваме конволюционна невронна мрежа, обучавайки я върху букви и не-букви, за да може да научи как изглеждат различните букви, гласи публикацията в блога.

Изследователите трябваше да обучават софтуера, използвайки не само чисто изглеждащи писма, но и мръсни. Писмата в реалния свят са помрачени от отражения, мръсотия, петна и всякакви странности, пише г-н Гуд. Така че ние създадохме нашия генератор на букви, за да създадем всякакви фалшиви мръсотии, за да имитираме убедително шума от реалния свят - фалшиви отражения, фалшиви петна, фалшиви странности навсякъде. Някои от

Някои от мръсните букви, използвани за обучение. (Снимка: Google)



The трето стъпка е търсенето на разпознатите букви в речника, за да се получат преводите. И за допълнителен опит за точност, справочните справки са приблизителни, в случай че S е погрешно разчетено като 5.

И накрая, преведеният текст се изобразява върху оригинала в същия стил.

Можем да направим това, защото вече сме намерили и прочели буквите в изображението, така че знаем точно къде се намират. Можем да разгледаме цветовете около буквите и да ги използваме, за да изтрием оригиналните букви. И тогава можем да нарисуваме превода отгоре, използвайки оригиналния цвят на преден план, гласи публикацията в блога.

За да бъде възможно най-ефективен и да позволи всички тези стъпки да бъдат изпълнени в реално време без интернет или връзка за данни, екипът на Google разработи много малка невронна мрежа с горна граница на плътността на информацията, с която може да се справи. Тъй като те генерираха свои собствени данни за обучение, беше важно да се включат правилните данни, но нищо допълнително, така че невронната мрежа не използва твърде голяма част от своята информационна плътност за маловажни неща. Пример може да бъде как трябва да разпознае буква с малко количество завъртане, но не твърде много.

В крайна сметка потребителите остават с още 20 езика, но със същата бърза скорост.

ВИЖТЕ СЪЩО: Екипът на AI на Google ни даде най-ниските резултати в техните изследвания на машинното обучение

Интересни Статии