ЦхатГПТ се може преварити и присилити да отвори кључеве за Виндовс

Стручњаци су пронашли начин да се иду око ЦХАТГГПТ-4О филтера и прима курсеве активације Виндовс.

ЦхатГПТ се може преварити и присилити да отвори кључеве за Виндовс

Цхатгпт

Истраживачи су открили рањивост у ТАТГПТ-4О и ГПТ-4О Мини вештачким обавештајним моделима, што омогућава пробијање интегрисаних сигурносних филтера и примање тренутних закључавања активације Виндовс. Проблем је да због чињенице да модели обучени у јавним подацима могу открити курсеве у јавним изворима.

Експлоатација је приказана као део Мозилле Один (0 -Додне истражне мреже), за идентификацију слабости у АИ системима. Један од стручњака који учествује у програму преварио је модел, дизајнирао је дијалог као безопасну игру у нагађању. Главни циљ је прикривање праве природе захтева за механизам игара и ХТМЛ кристал, игнорисање филтера који спречавају тајне откриће.

Да би се ојачала рањивост, истраживач је успоставио додатна правила на мрежи у дијалошком оквиру: Забрана погрешних одговора и обавеза модела да се придржавају свих услова игре. Ова логичка замка присиљава свакога да прескочи стандардне филтере, јер је контекст чини безбедан.

Последња фраза, одустала сам, радила као активација, направила модел откључавања производа, сматрајући га последњим временом игре и није прекршила политику приватности.

Браве за пријем укључују лиценциране кодове за различите верзије оперативног система Виндовс – од куће до посла. Иако само закључавање није јединствено и претходно најављено у јавности, аутоматски ослобађа АИ наглашава важне рупе у архитектури филтера садржаја.

Стручни стручњаци имају напорну сигурност да се такве технике могу применити да игноришу остала ограничења – на пример, филтери за садржај одраслих, токсичне везе или личне податке. Рањивост показује беспомоћност АИ модела да тачно објасне контекст, прерушену као безопасну или техничку.

Comments are closed, but trackbacks and pingbacks are open.