Google-ի նոր նեյրոցանցը գեներացնում է նկարներ ըստ նկարագրված տեքստի

Ամսաթիվ 25/05/2022 թ.

Google ընկերությունը ներկայացրեց Imagen նոր նեյրոցանցը, որը գեներացնում է նկարներ ըստ նկարագրված տեքստի: Imagen-ը սկզբում գեներացնում է 64x64 չափսերով նկար, այնուհետև այն աստիճանաբար մեծացնում է:

DrawBench տեստի ընթացքում նմանատիպ գործիքներով գեներացված նկարները ցուցադրվել են մարդկանց և նրանք նախընտրել են հենց Imagen-ով գեներացվածները:

Ի տարբերություն մեկ այլ հայտնի գործիքի՝ DALL-E-ի կամ DALL-E 2-ի, Google-ի այս գործիքն ու ծրագրային կոդը դեռ հասանելի չէ օգտատերերի համար:

Imagen-ի կայքում կարող եք տեսնել գեներացված նկարների օրինակներ, ինչպես նաև ընտրել բառեր, որոնց հիման վրա կգեներացվեն նկարները:

Նշեմ, որ շաբաթներ առաջ ռուսական «Сбер» ընկերությունը թողարկել էր ruDALL-E կոչվող նմանատիպ գործիք, որտեղ հնարավոր է նաև բացատրել գեներացվող նկարը ռուսերենով: Այդ գորքիքը կարող եք փորձարկել պաշտոնական կայքում: Ծրագրային բաց կոդով ևս մեկ նմանատիպ գործիք է CompVis Latent Diffusion-ը: