Bing

Microsoft Research vytvára systém schopný automaticky generovať „inteligentné“ titulky

Obsah:

Anonim

Určite ste sa stretli s popisom, ktorý je mätúci, nesprávny alebo hovorí málo o obrázku, na ktorý odkazuje; a je dokonca možné, že ak sa venujete publikovaniu vlastných článkov, bude pre vás najviac únavné vyplniť túto sekciu. Ľudia z Redmondu vytvorili nástroj, ktorého cieľom je uľahčiť vám prácu.

Práca publikovaná spoločnosťou Microsoft Research, ktorá sa opisuje ako „systém generovania titulkov“ schopný napodobňovať naratívne charakteristiky ľudského jazyka, teda technológiu, ktorá dokáže opísať snímky obrazovky, akoby o jednom z nás, s príslušným kontextom.Niečo, na čom spoločnosti ako Facebook, Microsoft a Google už nejaký čas pracujú, no tentoraz to prekonalo očakávania.

Z čoho pozostáva

Mal skvelý čas

Týmto spôsobom má systém schopnosť dokonca vyrozprávať celý príbeh z niekoľkých obrázkov, opísať ho a vyrozprávať, akoby bola to kniha. Nástroj, ktorý by sa podľa odborníkov mohol stať funkciou, ktorá určitým aplikáciám, aplikáciám na rozpoznávanie hlasu, automatickému generovaniu popisov v iných oblastiach a mnohým ďalším poskytuje ľudskejší dotyk.

Faktom je, že tool sa neobmedzuje len na stručné vyjadrenie toho, čo „vidí“, ale skôr poskytuje širší kontext situácie, ktorá sa odráža v obraze, dosahujúc „naratívny kontext a jedinečný štýl rozprávania“, vysvetlil Frank Ferraro, jeden z autorov tohto diela.Aby sme sa dostali do situácie, dáva nám jasný príklad

Jeho matka bola na neho hrdá

Preto navrhujeme nasledujúci prípad: „Predstavme si, že máme fotoalbum niekoľkých priateľov, ktorí oslávili narodeniny v Pub. Niektoré z prvých obrázkov zobrazujú ľudí, ktorí si objednávajú pivo a pijú ho, zatiaľ čo posledné zobrazujú niekoho, kto spí na pohovke,“ komentuje.

Konvenčný systém „môže jednoducho poukázať na niečo také, ako keď osoba leží na pohovke, zatiaľ čo náš systém by mohol zahŕňať, že sa pravdepodobne nachádza v takejto situácii, pretože je opitý po pár pohárikoch“ . Dodatok, ktorý poskytuje porozumenie a určitý emocionálny náboj, ktorý sa odráža aj v obrázkoch a popisoch fotografií v tomto článku.

Via | Prehľad technológie MIT

V systéme Xataka Windows | Microsoft spúšťa aplikáciu, ktorá určuje plemeno vášho psa

Bing

Voľba editora

Back to top button