„ChatGPT V4“ pasiekia juostą, SAT ir gali nustatyti išnaudojimus ETH sutartyse

GPT-4, naujausia dirbtinio intelekto (DI) pokalbių roboto ChatGPT versija, gali išlaikyti vidurinės mokyklos testus ir teisės mokyklos egzaminus, kurių balai yra 90 procentilio, ir turi naujas apdorojimo galimybes, kurių nebuvo įmanoma naudojant ankstesnę versiją.

Kovo 4 d. GPT-14 testo balų skaičiais pasidalijo jo kūrėjas OpenAI, atskleisdamas, kad jis taip pat gali konvertuoti vaizdo, garso ir vaizdo įvestis į tekstą, be to, kūrybiškiau ir patikimiau tvarko „daug niuansingesnes instrukcijas“.

„Jis išlaiko imitacinį baro egzaminą, kurio balas yra maždaug 10 % geriausių testą laikiusiųjų“, – pridūrė OpenAI. „Priešingai, GPT-3.5 balas buvo maždaug 10 proc.

Skaičiai rodo, kad GPT-4 LSAT egzamino 163 procentilyje pasiekė 88 balus – testo koledžo studentai turi būti išlaikyti Jungtinėse Valstijose, kad būtų priimti į teisės mokyklą.

*GPT-4 ir GPT-3.5 egzaminų rezultatai iš daugelio neseniai atliktų JAV egzaminų. Šaltinis:* *OpenAI*

GPT4 balas sudarytų geras sąlygas būti priimtas į 20 geriausių teisės mokyklų ir tik kelių balų trūksta iki skelbiamų balų, reikalingų norint patekti į tokias prestižines mokyklas kaip Harvardas, Stenfordas, Prinstonas ar Jeilis.

Ankstesnė „ChatGPT“ versija LSAT surinko tik 149 balus, todėl ji patenka į 40 proc.

GPT-4 taip pat surinko 298 balus iš 400 vienodo advokatūros egzamino metu – testą, kurį atliko neseniai baigę teisės studentai, leidžiantys jiems verstis advokato praktika bet kurioje JAV jurisdikcijoje.

*UBE balai turėjo būti leisti verstis advokato praktika kiekvienoje JAV jurisdikcijoje. Šaltinis:* *Nacionalinė advokatų egzaminuotojų konferencija*

Senoji „ChatGPT“ versija šiame teste patyrė sunkumų ir pateko į apatinį 10 % su 213 balų iš 400.

Kalbant apie SAT įrodymais pagrįsto skaitymo ir rašymo bei SAT matematikos egzaminus, kuriuos laikė JAV aukštųjų mokyklų studentai, norėdami įvertinti savo pasirengimą koledžui, GPT-4 balas buvo atitinkamai 93 ir 89 procentilis.

GPT-4 taip pat pasižymėjo „sunkiais“ mokslais: AP biologijos (85–100 %), chemijos (71–88 %) ir 2 fizikos (66–84 %) procentilių balai buvo gerokai aukštesni.

*GPT-4 ir GPT-3.5 egzaminų rezultatai iš daugelio naujausių JAV egzaminų.* *Šaltinis: OpenAI.*

Tačiau jo AP skaičiavimo balas buvo gana vidutinis ir buvo nuo 43 iki 59 procentilio.

Kita sritis, kurioje trūko GPT-4, buvo anglų literatūros egzaminai, skelbiant balus nuo 8 iki 44 procentilės per du atskirus testus.

„OpenAI“ teigė, kad GPT-4 ir GPT-3.5 šiuos testus atliko iš 2022–2023 m. praktikos egzaminų, o kalbos apdorojimo įrankiai „nebuvo specialūs mokymai“:

„Nerengėme specialių mokymų šiems egzaminams. Nedidelę dalį egzaminų problemų modelis matė mokymų metu, tačiau mes tikime, kad rezultatai yra reprezentatyvūs.

Rezultatai sukėlė baimę ir „Twitter“ bendruomenėje.

Susiję: Kaip ChatGPT paveiks Web3 erdvę? Pramonė atsako

Nickas Almondas, FactoryDAO įkūrėjas sakė, kovo 14,300 d. jo 14 4 „Twitter“ sekėjų, kad GPTXNUMX „išgąsdins žmones“ ir „sugrius“ pasaulinę švietimo sistemą.

Vertinimo teorija keletą metų buvo didelė mano gyvenimo dalis. Prieš daugelį metų galvojau apie šią dieną. Tiesiogine to žodžio prasme tuo metu skambėjau kaip rezidentas.
Bet… iš tikrųjų tai reiškia, kad nuo šio momento viskas, išskyrus prižiūrimą vertinimą, baigta.
- gėrimas ️² (@DrNickA) Kovo 14, 2023

Buvęs „Coinbase“ direktorius Conoras Groganas sakė, kad į GPT-4 įtraukė tiesioginę „Ethereum“ išmaniąją sutartį ir iš karto nurodė keletą „saugos spragų“ bei apibūdino, kaip kodą galima išnaudoti:

Į GPT-4 įtraukiau gyvą Ethereum sutartį.
Akimirksniu jis išryškino daugybę saugumo spragų ir nurodė paviršiaus sritis, kuriose galima pasinaudoti sutartimi. Tada patikrino konkretų būdą, kaip galiu pasinaudoti sutartimi pic.twitter.com/its5puakUW
– Konoras (@jconorrogan) Kovo 14, 2023

Ankstesni išmaniųjų sutarčių auditai „ChatGPT“ nustatė, kad pirmoji jo versija taip pat galėjo pakankamai aptikti kodo klaidas.

Rowanas Cheungas, AI informacinio biuletenio „The Rundown“ įkūrėjas, pasidalijo vaizdo įrašu, kuriame GPT perrašo ant popieriaus lapo ranka nupieštą netikrą svetainę į kodą.

Ką tik žiūrėjau, kaip GPT-4 ranka pieštą eskizą pavertė funkcionalia svetaine.
Tai beprotiška. pic.twitter.com/P5nSjrk7Wn
- Rowan Cheung (@rowancheung) Kovo 14, 2023