Այս օրերին հաճախ կարելի է լսել «բարձրաչափ» տվյալների մասին մեքենայական ուսուցման համատեքստում, բայց որպես եռաչափ էակ անհնար է պատկերացնել եռաչափից բարձր որևէ բան: Բարեբախտաբար, մենք կարող ենք օգտագործել մաթեմատիկական սահմանումներ՝ օրինակ վերցնելու շրջանագծի գաղափարը (սովորաբար մի բան, որը գոյություն ունի երկու հարթության մեջ) և այն հասցնել մինչև երեքի կամ իջնել մեկին: Այս հոդվածում մենք մի փոքր կխաղանք չափերի հետ:

Երբ մենք խոսում ենք շրջանագծի մասին, նկատի ունենք մի շարք կետեր, որոնք բոլորը նույն հեռավորության վրա են գտնվում ինչ-որ միջին կետից: Մեր հավասարումները գեղեցիկ դարձնելու համար, ենթադրենք, որ շրջանագծի կեսը գտնվում է R² երկչափ հարթության (0,0) կետում և ասենք, որ ցանկանում ենք, որ մեր շրջանագիծն ունենա 1 շառավիղ, այնպես որ բոլոր կետերը պետք է լինեն 1 հեռավորության վրա։ կենտրոնից հեռու։

Մենք երկրաչափությունից գիտենք, որ յուրաքանչյուր p կետ R²-ում ունի երկու բաղադրիչ, որոնք մենք կանվանենք x_1և x_2՝ եզակիորեն սահմանելու նրա դիրքը տարածության մեջ. p=(x_1,x_2): Մտածելով երկրաչափության դասի մասին՝ մենք հիշում ենք՝ օգտագործելով Պյութագորասի թեորեմը սկզբնաղբյուրի շուրջ 1 շառավղով շրջանագծի վրա գտնվող նման կետի համար p, մենք ունենք.

որպես այս շրջանագծի հավասարում:

Այսպիսով, մենք կարող ենք նկարագրել այս շրջանագծի բոլոր կետերը որպես հարթության բոլոր կետեր, որոնք կատարում են (1) հավասարումը: Այս ամենը միասին դնելով՝ մենք ունենք հետևյալ սահմանումը.

Այժմ մենք կարող ենք կատարել մեր առաջին քայլը հարթության մեջ: Ի՞նչ կլիներ, եթե մենք միավորներ վերցնեինք ոչ թե R²-ից, այլ R³ եռաչափ տարածությունից, որը կատարում էր (2) հավասարման համարժեքը եռաչափում: Դե, R³ կետը ունի երեք բաղադրիչ՝ p=(x_1,x_2,x_3) և մենք դեռ ուզում ենք, որ բոլոր կետերի հեռավորությունը կենտրոնից լինի մեկ, այնպես որ մենք կգրենք այդ սահմանումը որպես

Եվ եթե մի պահ մտածենք, ապա եռաչափ տարածության բոլոր կետերի հավաքածուն, որոնք գտնվում են սկզբից մեկ հեռավորության վրա, գնդիկ են՝ անսահման բարակ մակերեսով բասկետբոլի նման: Այսպիսով, 2d շրջանից դեպի 3d գունդ անցնելու համար անհրաժեշտ էր ընդամենը մի փոքր փոխել մեր մաթեմատիկական սահմանումը: Ի՞նչ կլիներ, եթե մենք այն փոխեինք այլ կերպ, իսկ եթե վերցնեինք մեր կետը p ոչ թե 2d հարթությունից, այլ միաչափ բանից՝ իրական թվային գծից: Ըստ մեր սահմանման՝ մենք կունենայինք.

Թվային գծում պարզապես այնքան էլ շատ տարբերակներ չկան այն կետերի համար, որոնք սկզբից մեկ հեռավորության վրա են: Այսպիսով, այս «շրջանակը» 1d-ում ընդամենը զույգ միավոր է, մեկը x=1-ում և մեկը՝ x=-1:

Այս ձևերը, որոնք սահմանել ենք այստեղ, մենք անվանում ենք գնդեր. շրջանագիծը (2) միաչափ գունդ է[2], բասկետբոլի գնդակը (3) երկչափ գունդ է, և երկու կետերը թվային տողը (4) կազմում է զրոյական գունդ:

Եթե ​​թույլ տանք, որ մաթեմատիկական նշումը մեզ մի փոքր առաջ տանի, մենք կարող ենք ընդհանրացնել և հստակ իմանալ, թե ինչպես կարելի է սահմանել ոլորտը 4, 5 կամ n չափումներով: Օգտագործելով վերը նշված սահմանումները, մենք հեշտությամբ կարող ենք տեսնել, թե ինչպես կարելի է սահմանել ոլորտը n-տարածքում:

Այս սահմանումը մեզ ցույց է տալիս, որ չափումը պարզապես մի բան է, որը մենք կարող ենք հավաքել վերև կամ վար. նույնիսկ եթե մենք չգիտենք, թե ինչպես պատկերացնել քառաչափ ոլորտը, մենք հստակ գիտենք, թե ինչպես նկարագրել այն մաթեմատիկորեն:

Բայց սա ի՞նչ կապ ունի մեծ տվյալների հետ: Պարզվում է, որ ծավալայինությունը հաճախ մեծ տվյալների մաս է կազմում: Պատկերացրեք ֆիլմը որպես ֆիլմ-տարածության մեկ կետ: Ֆիլմ-տարածքն ունի բազմաթիվ չափումներ՝ ժանր, վարկանիշ, RottenTomatoes-ի պարտիտուր, իր արժանացած ցանկացած մրցանակ, ռեժիսոր, դերասաններ, արտադրության երկիր, բյուջե, լեզու, թողարկված կինոթատրոններում կամ պարզապես հեռուստատեսությամբ, սերիալ, ստուդիա և այլն: Կարող ենք ցանկանալ: պարզել, թե որ ֆիլմերն են նման և կցանկանայինք դա անել՝ ֆիլմերի տարածության մեջ իրար մոտ կետեր գտնելով, բայց մենք չենք կարող պատկերացնել այս 12+ չափերը: Արդյո՞ք կա այդ բարձր չափսերը նախագծելու ավելի ցածր չափերը, որպեսզի մենք կարողանանք նայել նմանություններին՝ չկորցնելով կարևոր տեղեկատվությունը: Ահա թե ինչի մասին կխոսենք հաջորդ անգամ:

Չափման վերաբերյալ ավելի հետաքրքիր մտքերի համար խորհուրդ ենք տալիս YouTube-ի 3blue1brown ալիքը և մասնավորապես այս տեսանյութը:

Սա մեր Dimensionality Reduction շարքի առաջին մասն է: 2-րդ մասը կարող եք գտնել այստեղ:

Հեղինակ՝ Emily Searle-White, ZDF Digital

Ծանոթագրություններ:

[1] Նկատի ունեցեք, որ սովորաբար Պյութագորասի բանաձևը a²+b²=c² է, բայց 1-ն իր սեփական քառակուսի և քառակուսի արմատն է:

[2] Շրջանակը «ապրում է» երկու հարթություններում, բայց շրջանակը կազմող մակերեսը միայն միաչափ է։