Foto: Freepik

Problém „halucinací“

Jedním z hlavních problémů generativní umělé inteligence je fenomén halucinací, kdy AI modely vytvářejí nepřesné nebo zcela nepravdivé informace, a přitom se tváří jako autoritativní. Tento problém vedl mnoho odborníků k názoru, že AI není schopna efektivně detekovat a opravovat své vlastní chyby. Výzkumníci z DeepMind společnosti Google například uvedli, že současné modely LLM (large language models) nedokážou samostatně opravovat své chyby.

CriticGPT: nový přístup OpenAI

OpenAI však nesouhlasí s těmito závěry a představila CriticGPT, druhou neuronovou síť, která se specializuje na odhalování chyb v kódu generovaném ChatGPT. CriticGPT funguje jako kritický nástroj, který analyzuje a ukládá chyby v mezipaměti, čímž pomáhá programátorům identifikovat a opravovat problémy v kódu.

Foto: Freepik

Metoda a výsledky

CriticGPT je trénován pomocí zpětné vazby od lidských programátorů, kteří hodnotí kritiku generovanou AI. Tento přístup umožňuje CriticGPT zlepšovat své schopnosti identifikace chyb na základě lidských hodnocení. Výsledky ukazují, že CriticGPT dokáže najít více chyb než tradiční lidské recenze, což naznačuje jeho potenciál jako cenného nástroje pro programátory.

Výzkumníci také testovali CriticGPT s úmyslně vloženými chybami v kódu. Lidské týmy, které analyzovaly tyto chyby, poskytly vysvětlení, která CriticGPT absorboval, a naučil se tak lépe rozpoznávat a popisovat chyby. Tento trénink vedl k tomu, že CriticGPT dokázal detekovat více chyb než samotní programátoři, což z něj činí efektivní nástroj pro zlepšování kvality kódu.

Výzvy a budoucnost

Navzdory úspěchům má CriticGPT své výzvy. Stejně jako ostatní modely umělé inteligence může i CriticGPT občas halucinovat a tvrdit, že našel chyby, které tam nejsou. Výzkumníci z OpenAI se snaží tento problém minimalizovat, ale přiznávají, že najít správnou rovnováhu mezi detekcí chyb a minimalizací falešných poplachů je složité.

Další výzvou je uzavřenost systému CriticGPT. Tréninková data a zdrojový kód nejsou veřejně dostupné, což omezuje možnosti externího ověřování a auditu modelu. Tento nedostatek transparentnosti může vyvolávat otázky ohledně etiky a bezpečnosti používání CriticGPT.

Závěr

CriticGPT představuje významný krok vpřed v oblasti detekce a opravy chyb generovaných umělou inteligencí. Ačkoli čelí určitým výzvám, jeho schopnost identifikovat a opravovat chyby v kódu slibuje zvýšení spolehlivosti a efektivity generativní AI. OpenAI tak pokračuje ve své misi zlepšovat a inovovat technologie umělé inteligence, které mají potenciál usnadnit práci programátorů a zlepšit kvalitu software.

Zdroj :ZDNet.com (odkaz)