Google прави мащабирането и подобряването на снимки реалност

Вероятно сте гледали фантастични филми или телевизионни предавания, където главният герой иска да увеличите изображението и да подобрите резултата - да покажете лице, или регистрационен номер, или друг ключов детайл. Най-новите системи с изкуствен интелект (AI) на Google, базирани на т.нар дифузионни модели, могат да изпълнят този трик.

Това е сложен процес за овладяване, защото по същество добавя детайли към изображение, което камерата не е заснела първоначално, като използва супер интелигентни предположения, базирани на други подобни изображения.

Google

В Google тази техника се нарича синтез на естествено изображение и в този конкретен сценарий ултрависока резолюция на изображението. Започвате с малка, пикселизирана снимка и завършвате с нещо остро, ясно и естествено. Може да не е точно оригиналът, но е достатъчно близо, за да изглежда истински за човешкото око.

Google представи два нови AI инструмента за тази работа. Първият се нарича SR3, или Super-Resolution via Repeated Refinement, и работи, като добавя шум към изображение и след това го премахва. Чрез поредица от вероятностни изчисления, базирани на голяма база данни от изображения и малко магия за машинно обучение, SR3 може да си представи как изглежда версия със супер висока разделителна способност на пикселно изображение с ниска разделителна способност.

Вторият инструмент е CDM или Cascaded Diffusion Models. Google ги описва като „тръбопроводи“, по които дифузионните модели – включително SR3 – могат да бъдат насочени за мащабиране на висококачествено изображение. Той взема подобрени модели и ги превръща в по-големи изображения.

Google

Чрез използването на различни модели за подобрение при различни разделителни способности, CDM подходът е в състояние да надмине алтернативните методи за мащабиране на изображения, според Google. Новият AI двигател беше тестван в ImageNet, гигантска база данни от тренировъчни изображения, които обикновено се използват за изследване на визуалното разпознаване на обекти.

Крайните резултати на SR3 и CDM са впечатляващи. В стандартен тест с 50 доброволци, изображения на човешки лица, генерирани от SR3, бяха объркани с реални снимки около 50% от времето – и като се има предвид, че идеалният алгоритъм трябва да постигне 50%, това е впечатляващо. Струва си да се повтори, че тези подобрени изображения не съвпадат точно с оригиналите, те са внимателно изчислени симулации, базирани на математиката на вероятностите.

Google

Google обещава много повече от новите си AI двигатели и свързаните с тях технологии – не само по отношение на увеличаване на изображения на лица и други природни обекти, но и в други области на вероятностно моделиране.

Прочетете също:

Dzhereloнаучно предупреждение

Регистрирай се

0 Коментари

Вградени рецензии

Вижте всички коментари

Други статии

Като във филмите: новият AI на Google за обработка на снимки прави мащабирането и подобряването им реалност

Последни коментари