OpenAI zdaj prinaša lažje urejanje slik v ChatGPT-ju in lažje ustvarjanje vizualnih prikazov za poslovno rabo, ki vključujejo dolga, berljiva besedila, kar bi lahko povečalo privlačnost klepetalnika za podjetja in običajne uporabnike. Na torkovem dogodku v živo je podjetje s sedežem v San Franciscu pokazalo, kako bodo uporabniki ChatGPT-ja lahko natančneje prilagajali slike prek niza replik s klepetalnikom, poroča Bloomberg.
Uporabnik lahko na primer zahteva sliko polža v mestu, nato pa prosi za spremembo ozadja in dodajanje klobuka. ChatGPT bo bolje generiral tudi slike s koherentnim besedilom, zaradi česar bo bolj uporaben pri izdelavi diagramov, infografik in logotipov za profesionalno rabo. Uporabnik lahko od klepetalnika zahteva tudi generiranje fotorealistične slike prilagojenega menija ali zemljevidov. Nova verzija bo tudi natančneje izvajala kompleksne zahteve glede kompozicije slike, je sporočilo podjetje.
OpenAI vse bolj poskuša pozicionirati ChatGPT kot univerzalno aplikacijo, ki združuje iskalnik, glasovnega asistenta in video generator. S svojimi najnovejšimi izboljšavami želi vgraditi naprednejše funkcije za obdelavo slik, ki bi bile uporabne tako v osebne kot poslovne namene. Novost lahko pomaga ChatGPT-ju, da ostane korak pred konkurenco, kot je xAI Elona Muska, ki je prav tako dodal generatorje slik.
Vseeno si lahko, podobno kot pri drugih uporabah umetne inteligence, ChatGPT pri ustvarjanju slik včasih “izmisli“ določene elemente, na primer sliki doda lažna imena držav. V objavi na blogu je OpenAI pojasnil, da se te napake lahko pojavijo pri manj natančnih uporabniških zahtevah (“promptih”). Obenem so priznali, da ima njihova umetna inteligenca težave pri ustvarjanju majhnega besedila in besedila v nelatiničnih pisavah.
Preberite več:
Poleg tega lahko izdelava slike z novo funkcijo traja do ene minute, navaja podjetje v blogu. Med prenosom v živo je izvršni direktor OpenAI Sam Altman povedal, da proces traja dlje, ker so slike podrobnejše. Nove zmogljivosti so z modelom OpenAI GPT-4o, ki je odprt tako za brezplačne kot plačljive uporabnike, na voljo od torka. Podjetje je sporočilo, da bo nove funkcije v prihodnjih tednih postopoma uvedlo tudi za razvijalce programske opreme, ki uporabljajo njegov API (vmesnik za programiranje aplikacij).