Ստացեք մոդելներ, չափումներ և արտեֆակտներ, որոնք գրանցված են հեռավոր MLflow-ի հետագծման սերվերում Databricks-ում
Նախորդ հոդվածում. Ավտոմատացրեք ձեր մեքենայական ուսուցման փորձերը MLflow-ով», մենք մի քանի գործարկում ենք կատարել գինու գների կանխատեսման տվյալների բազայի վրա:
Մենք գրանցել ենք արդյունքները, արտեֆակտները և մոդելի պարամետրերը տեղական Հետագծման սերվերում: Բայց ի՞նչ պետք է անենք, երբ աշխատում ենք թիմում և ցանկանում ենք համեմատել տեղական մեքենայից դուրս մեր գործընկերների պատրաստած տեղեկամատյանները:
Այս դեպքում մենք պետք է ստեղծենք հեռավոր Հետագծման սերվեր, որտեղ արտեֆակտները գտնվում են հեռավոր հոսթի վրա: Դա անելու համար մենք կօգտագործենք օրինակը Azure Databricks-ի վրա:
Նախ, մենք պետք է մուտք գործենք Databricks աշխատանքային տարածք: Դեմո նպատակի համար ես մուտք եմ գործում համայնքի ամպային Databricks, քանի որ այն ապահովում է բավականաչափ ֆունկցիոնալություն պարզ ML փորձերի համար անվճար: Մենք գրանցվում ենք և լրացնում ենք https://databricks.com/try-databricks հաշիվ ստեղծելու ձևը: Դրանից հետո գլխավոր էջը պետք է այսպիսի տեսք ունենա.
Երբ մենք մուտք գործենք մեր աշխատանքային տարածք, մենք պետք է տեղադրենք CLI գործիքը հեռավոր աշխատանքային տարածքի հետ ինտերֆեյսի համար: CLI-ն տեղադրելու համար ես օգտագործել եմ Python 3.8.8 տարբերակը հետևյալ pip հրամանով.
pip install databricks-cli
Երբ CLI-ն տեղադրվի, մենք կարող ենք ստուգել դրա տարբերակը
databricks --version
Այնուհետև մենք պետք է կարգավորենք նույնականացումը: Դա անելու 2 եղանակ կա
- տրամադրելով օգտվողի անուն և գաղտնաբառ
- Databricks-ի անձնական մուտքի նշան ստեղծելու և տրամադրելու միջոցով: Այս մեթոդը խորհուրդ է տրվում, բայց այս հոդվածը գրելու պահին ես օգտվողի կարգավորումներում չգտա նշանային սերունդ, գուցե այն պատճառով, որ ես օգտագործում եմ Համայնքի ամպը:
Այսպիսով, մենք կշարունակենք առաջին տարբերակը: Նույնականացումը կարգավորելու համար գրեք հրամանը
databricks configure
Այնուհետև հուշման մեջ մենք պետք է տրամադրենք
- Հյուրընկալողի անունը. Ընդհանուր առմամբ, դուք պետք է մուտքագրեք ձեր աշխատանքային տարածքի URL-ը
https://<instance name>.cloud.databricks.com
ձևաչափով: Համայնքային Cloud-ի դեպքում մենք մուտքագրում ենք https://community.cloud.databricks.com/: - Օգտվողի անունը (ձեր էլ.փոստը)
- Գաղտնաբառ
Հուշումն ավարտելուց հետո ձեր հավատարմագրերը կպահվեն ~/.databrickscfg
ֆայլում, որպեսզի կարողանաք ստուգել դրանք:
cat .databrickscfg
Այժմ մենք կարող ենք ստուգել, որ CLI-ն կարող է փոխազդել հեռավոր աշխատանքային տարածքի հետ: Գործարկեք հետևյալ հրամանը՝ աշխատանքային տարածքի թղթապանակի բովանդակությունը տեսնելու համար:
databricks workspace ls /Users/<your username>
Ավելի մանրամասն բացատրություն այն մասին, թե ինչպես ստեղծել ավելի առաջադեմ մուտք, ինչպիսիք են բազմաթիվ պրոֆիլներ և հրամանների խմբեր, կարող եք գտնել Databricks CLI փաստաթղթերում:
Երբ դա արվի անմիջապես MLflow ներմուծումից հետո, դրեք հետագծման URI և փորձի թղթապանակը Databricks աշխատանքային տարածքում:
import mlflow mlflow.set_tracking_uri("databricks") mlflow.set_experiment("/Users/<your username>/SpanishWinePrediction")
Այնուհետև մենք կատարում ենք նույն փորձը լոգիստիկ ռեգրեսիայի, պատահական անտառի և KNN ռեգրեսիայի մոդելների հետ, որոնք արվել են նախորդ հոդվածում: Գործարկումները պետք է ուղղակիորեն վերբեռնվեն հեռավոր աշխատանքային տարածք: MLflow UI-ի գլխավոր էջը պետք է այսպիսին լինի.
Կրկին այստեղ մենք կարող ենք համեմատել կողք կողքի վավերացման չափանիշները յուրաքանչյուր գործարկման համար:
Այս հոդվածում մենք կարգավորել ենք հեռակառավարման հետագծման սերվերը և գրանցել ենք փորձարկման արդյունքները: Շնորհակալություն ընթերցանության համար, և ես կգնահատեմ ձեր կարծիքը ներքևում գտնվող մեկնաբանությունների բաժնում: