Ненамерна последица интернета: подстицање бума вештачке интелигенције нашим подацима
Summary
Процват индустрије вештачке интелигенције изграђен је на подацима, а ти подаци долазе са интернета, који су на крају дошли од нас, корисника. Од личних блогова до веб страница и Реддит тема, свака реч коју делимо допринела је образовању АИ цхатбота […]

Процват индустрије вештачке интелигенције изграђен је на подацима, а ти подаци долазе са интернета, који су на крају дошли од нас, корисника. Од личних блогова до веб страница и Реддит тема, свака реч коју делимо допринела је образовању АИ цхатбота широм света. Анализа јавног скупа података који се нашироко користи за обуку вештачке интелигенције, коју је спровео Васхингтон Пост, показује колико широко је индустрија узорковала 30-годишњу ризницу веб издаваштва да подучава њихове неуронске мреже.
Иако ова масивна вербална пренамена изазива важну правну свађу око тога да ли то треба третирати као поштену употребу или као крађу, она такође инспирише лични обрачун за милионе који су допринели изградњи онлајн света какав данас познајемо. Мислили смо да делимо своја срца и умове, и наравно, јесмо. Али, не схватајући то, такође смо креирали базу података, непотпуну, али богату, људског израза која омогућава несвакидашње вешту гимнастику довршавања реченица ЦхатГПТ-а и његових конкурената.
Међутим, ова спознаја је већ утицала на визуелне креаторе, као што су фотографи и илустратори, који се боре са коришћењем свог рада у садржају генерисаном вештачком интелигенцијом. Музичари се суочавају са истом врстом епифаније, јер факсимили њихових дела изазвани вештачком интелигенцијом постају све чешћи. Али много више нас је писало на интернету него што је снимало песме или стварало визуелну уметност.
Истраживање Васхингтон Пост-а омогућава корисницима да унесу било које име интернет домена да виде колико је оно допринело једној бази за обуку АИ. Анализирани скуп података садржао је преко пола милиона личних блогова, што представља 3,8% укупних језичких делова. Иако су базе података за обуку огромне, оне су једва репрезентативне, са неким културама, групама и субјектима који су превелики, а други су неправедно занемарени. Штавише, све пристрасности, ограничења и токсични аспекти интернет културе показују се у подацима о обуци АИ.
Како се АИ глад за подацима за обуку наставља, ненамерна последица 30-годишње историје интернета као базе података људског изражавања сада је у центру пажње. Дигиталне залихе и депоније информација, идеја и осећања које смо створили једни за друге постале су гориво за пробој АИ. Међутим, ово поставља питања о будућем утицају АИ на производњу оригиналног дела и ризику да будући модели АИ буду заглављени са застарелим информацијама.
Ако ослободимо поплаву симулакрума на нашим јавним мрежама, ризикујемо да обесхрабримо људе да наставе да деле или чак праве своје оригинално дело. То би могло да остави будуће моделе вештачке интелигенције заувек заглављени са замрзнутим резултатом човечанства око 2000-2020, без ничег новијег за учење. Како настављамо да обликујемо вештачку интелигенцију, она ће заузврат обликовати нашу будућност на начине које не можемо да предвидимо. Ово је кључни подсетник да ће све што радимо са и са вештачком интелигенцијом имати последице које ће одјекнути далеко у будућности.