Ստացեք մոդելներ, չափումներ և արտեֆակտներ, որոնք գրանցված են հեռավոր MLflow-ի հետագծման սերվերում Databricks-ում

Նախորդ հոդվածում. Ավտոմատացրեք ձեր մեքենայական ուսուցման փորձերը MLflow-ով», մենք մի քանի գործարկում ենք կատարել գինու գների կանխատեսման տվյալների բազայի վրա:

Մենք գրանցել ենք արդյունքները, արտեֆակտները և մոդելի պարամետրերը տեղական Հետագծման սերվերում: Բայց ի՞նչ պետք է անենք, երբ աշխատում ենք թիմում և ցանկանում ենք համեմատել տեղական մեքենայից դուրս մեր գործընկերների պատրաստած տեղեկամատյանները:

Այս դեպքում մենք պետք է ստեղծենք հեռավոր Հետագծման սերվեր, որտեղ արտեֆակտները գտնվում են հեռավոր հոսթի վրա: Դա անելու համար մենք կօգտագործենք օրինակը Azure Databricks-ի վրա:

Նախ, մենք պետք է մուտք գործենք Databricks աշխատանքային տարածք: Դեմո նպատակի համար ես մուտք եմ գործում համայնքի ամպային Databricks, քանի որ այն ապահովում է բավականաչափ ֆունկցիոնալություն պարզ ML փորձերի համար անվճար: Մենք գրանցվում ենք և լրացնում ենք https://databricks.com/try-databricks հաշիվ ստեղծելու ձևը: Դրանից հետո գլխավոր էջը պետք է այսպիսի տեսք ունենա.

Երբ մենք մուտք գործենք մեր աշխատանքային տարածք, մենք պետք է տեղադրենք CLI գործիքը հեռավոր աշխատանքային տարածքի հետ ինտերֆեյսի համար: CLI-ն տեղադրելու համար ես օգտագործել եմ Python 3.8.8 տարբերակը հետևյալ pip հրամանով.

pip install databricks-cli

Երբ CLI-ն տեղադրվի, մենք կարող ենք ստուգել դրա տարբերակը

databricks --version

Այնուհետև մենք պետք է կարգավորենք նույնականացումը: Դա անելու 2 եղանակ կա

  • տրամադրելով օգտվողի անուն և գաղտնաբառ
  • Databricks-ի անձնական մուտքի նշան ստեղծելու և տրամադրելու միջոցով: Այս մեթոդը խորհուրդ է տրվում, բայց այս հոդվածը գրելու պահին ես օգտվողի կարգավորումներում չգտա նշանային սերունդ, գուցե այն պատճառով, որ ես օգտագործում եմ Համայնքի ամպը:

Այսպիսով, մենք կշարունակենք առաջին տարբերակը: Նույնականացումը կարգավորելու համար գրեք հրամանը

databricks configure

Այնուհետև հուշման մեջ մենք պետք է տրամադրենք

  • Հյուրընկալողի անունը. Ընդհանուր առմամբ, դուք պետք է մուտքագրեք ձեր աշխատանքային տարածքի URL-ը https://<instance name>.cloud.databricks.com ձևաչափով: Համայնքային Cloud-ի դեպքում մենք մուտքագրում ենք https://community.cloud.databricks.com/:
  • Օգտվողի անունը (ձեր էլ.փոստը)
  • Գաղտնաբառ

Հուշումն ավարտելուց հետո ձեր հավատարմագրերը կպահվեն ~/.databrickscfg ֆայլում, որպեսզի կարողանաք ստուգել դրանք:

cat .databrickscfg

Այժմ մենք կարող ենք ստուգել, ​​որ CLI-ն կարող է փոխազդել հեռավոր աշխատանքային տարածքի հետ: Գործարկեք հետևյալ հրամանը՝ աշխատանքային տարածքի թղթապանակի բովանդակությունը տեսնելու համար:

databricks workspace ls /Users/<your username>

Ավելի մանրամասն բացատրություն այն մասին, թե ինչպես ստեղծել ավելի առաջադեմ մուտք, ինչպիսիք են բազմաթիվ պրոֆիլներ և հրամանների խմբեր, կարող եք գտնել Databricks CLI փաստաթղթերում:

Երբ դա արվի անմիջապես MLflow ներմուծումից հետո, դրեք հետագծման URI և փորձի թղթապանակը Databricks աշխատանքային տարածքում:

import mlflow
mlflow.set_tracking_uri("databricks")
mlflow.set_experiment("/Users/<your username>/SpanishWinePrediction")

Այնուհետև մենք կատարում ենք նույն փորձը լոգիստիկ ռեգրեսիայի, պատահական անտառի և KNN ռեգրեսիայի մոդելների հետ, որոնք արվել են նախորդ հոդվածում: Գործարկումները պետք է ուղղակիորեն վերբեռնվեն հեռավոր աշխատանքային տարածք: MLflow UI-ի գլխավոր էջը պետք է այսպիսին լինի.

Կրկին այստեղ մենք կարող ենք համեմատել կողք կողքի վավերացման չափանիշները յուրաքանչյուր գործարկման համար:

Այս հոդվածում մենք կարգավորել ենք հեռակառավարման հետագծման սերվերը և գրանցել ենք փորձարկման արդյունքները: Շնորհակալություն ընթերցանության համար, և ես կգնահատեմ ձեր կարծիքը ներքևում գտնվող մեկնաբանությունների բաժնում:

Հղումներ