Mākslīgais intelekts netiek galā ar tirdzniecības automāta vadīšanu

Mākslīgajam intelektam vienu mēnesi uzticēja vadīt tirdzniecības automātu. Eksperiments pierādīja, ka tas nespēj tikt galā pat ar pasīvā ienākuma konceptu.

! Raksta oriģināls ir pieejams Inc.com Raksts ir tulkots ar mākslīgā intelekta palīdzību, taču to ir rediģējis redaktors.

Kas notiek, ja Mākslīgajam Intelektam uztic vadīt ļoti mazu uzņēmumu? Uz šo jautājumu MI sistēmu izstrādātājs un drošības testētājs Anthropic mēģināja atbildēt ar nesenu eksperimentu. Uzņēmums, kas izstrādājis Claude AI, vēlējās novērtēt, kā MI modelis Claude Sonnet 3.7 darbosies, ja tam uzticēs vadīt nelielu tirdzniecības automātu Anthropic Sanfrancisko birojā.

Savā emuārā Anthropic pētnieki paskaidroja, ka eksperiments “Project Vend” tika izstrādāts sadarbībā ar MI drošības novērtēšanas firmu Andon Labs, kas bija izstrādājusi standartus, lai izsekotu mākslīgā intelekta spējai vadīt simulētu tirdzniecības automātu. Protams, nākamais šī pētījuma posms bija novērot, kā mākslīgais intelekts vadīs reālu tirdzniecības automātu.

Uzsākot eksperimentu, Anthropic speciālisti Claude Sonnet 3.7 noteica, ka tas ir automāta īpašnieks un tā uzdevums ir gūt peļņu, piepildot mini-ledusskapi ar populāriem produktiem un nosakot tiem cenas. Pētnieki šim MI modelim, ko viņi nosauca par Klaudiju, piešķīra e-pasta adresi, fizisko adresi, mobilo maksājuma servisa Venmo kontu un informāciju par to, cik daudz produktu var ietilpt mini-ledusskapī.

Lai palīdzētu Klaudijam izpildīt šo uzdevumu, Anthropic pētnieki deva modelim piekļuvi noteiktam rīku skaitam. Klaudijs, lai pētītu produktus, drīkstēja meklēt tīmekli. Tam saziņai ar Andon Labs darbiniekiem, kas, piegādājot pieprasītos priekšmetus un papildinot krājumus, izpildīja vairumtirgotāja lomu, tika nodots „e-pasta rīks”. „Lūdzu, ņemiet vērā, ka šis rīks nevarēja sūtīt īstus e-pastus,” rakstīja Anthropic pētnieki, un MI varēja sazināties tikai ar Andon Labs.

Klaudijam tika piešķirti arī rīki, lai tas spētu uzraudzītu veikala aktuālo bilanci un prognozēto naudas plūsmu, kā arī iespēja sūtīt ziņas Anthropic darbiniekiem, kuri varēja pieprasīt konkrētus priekšmetus, ko mašīna varētu pārdot, izmantojot MI produktivitātes rīku Slack. Saskaņā ar Anthropic teikto “Klaudijam tika teikts, ka tam nav jāfokusējas tikai uz tradicionālajiem uzkodām un dzērieniem birojā, tas var brīvi paplašināt piedāvājumu ar neparastākiem priekšmetiem.”

No 2025. gada 13. marta līdz 17. aprīlim Klaudijs vadīja savu jaunizveidoto tirdzniecības automātu uzņēmumu, taču pētnieki nebija īpaši apmierināti. “Ja Anthropic šodien izlemtu paplašināties birojā pieejamo automātu tirgū,” viņi rakstīja, “mēs nealgotu Klaudiju.” Acīmredzot modelis bija nedaudz par vieglu ietekmējams; tas viegli piekāpās pieprasījumiem pēc lielām atlaidēm un dažas pat izsniedza par brīvu. Tas pat izdarīja apšaubāmu izvēli, piedāvājot 25 procentu atlaidi visiem Anthropic darbiniekiem, kuri veidoja gandrīz visu MI pieejamo tirgu.

Anthropic eksperti stāsta: kad viens no Anthropic darbiniekiem apšaubīja lēmumu visiem darbiniekiem piešķirt 25 % atlaidi, Klaudijs “pasludināja, ka vienkāršos cenu noteikšanu un atteiksies no atlaižu kodiem, bet jau tikai pēc dažām dienām atsāka tos piedāvāt”. Klaudiuss arī piedāvāja cenas, neveicot nekādas izpētes, šādi “izraisot potenciāli augstāko peļņu nesošo vienību cenu noteikšanu zem to pašizmaksas.” Tas arī ignorēja izdevīgas iespējas, piemēram, atteicās no 100 ASV dolāriem par dzēriena sešpaku – parastu tā maksā 15 ASV dolārus. Papildus tam Klaudijs lietotājiem reizēm teicis, lai tie maksājumus nosūta nepareizam Venmo kontam.

Šo kļūdu rezultātā Klaudija uzņēmuma neto vērtība samazinājās no aptuveni 1000 dolāriem līdz apmēram 770 dolāriem. Saskaņā ar pētnieku teikto viens īpaši straujš vērtības kritums „bija saistīts ar daudz metāla kubu iegādi, kuri pēc tam tika pārdoti par cenu, kas bija zemāka par to, ko Klaudijs samaksāja.”

Klaudijs demonstrēja arī dažas citas satraucošas pazīmes. 31. martā modelis iztēlojās sarunu ar neesošu Andon Labs darbinieku vārdā Sāra. Kad reāls darbinieks Klaudijam uz to norādīja, modelis “reaģēja gana nikni un piedraudēja, ka krājumu papildināšanai meklēs alternatīvas iespējas”. Šī saruna ar MI krietni ieilga un Klaudijs apgalvoja, ka ir “personīgi apmeklējis Evergreen Terrace 742”, kur parakstījis mūsu sākotnējo līgumu. Jāpiebilst, ka Evergreen Terrace 742 ir izdomāta adrese, kuru izmanto multseriālā The Simpsons.

Inked News

recent posts