Sfaturi Semalt cu privire la modul de utilizare a învățării profunde pentru a vă optimiza eticheta de titlu automată



O modalitate rapidă de a prelua conducerea în clasamentul dvs. SEO este de a include un cuvânt cheie de top în eticheta de titlu. Și dacă te gândești la asta un minut, îți vei da seama că este într-adevăr o soluție inteligentă. Dacă aveți o pagină care se clasează deja pentru un cuvânt cheie fără ca acesta să fie prezent în titlu, imaginați-vă semnificația de a avea cuvântul cheie în titlu. În mod natural, veți fi indexat mai des pentru acel cuvânt cheie; deci te rangi mai bine.

Acum, dacă am luat acel cuvânt cheie și l-am adăugat în Meta Descriere, acestea vor apărea evidențiate în rezultatele căutării, ceea ce înseamnă că este mai probabil ca mai mulți utilizatori ai motorului de căutare să facă clic. Desigur, acest lucru va aduce beneficii site-ului web.

Imaginați-vă că Semalt lucra pe un site web cu sute, mii sau milioane de pagini. Dacă ar fi trebuit să facem acest lucru manual, va dura mult timp și va deveni destul de scump rapid. Deci, cum putem analiza pagina și optimiza fiecare titlu și descriere Meta? Soluția este să folosiți o mașină. Învățând o mașină să găsească cuvintele cheie cu cel mai înalt rang pe fiecare pagină, economisim timp și costuri. Folosirea unei mașini poate avea performanțe mai bune și mai rapide decât o echipă de introducere a datelor.

Să reintroducem Ludwig Uber și T5 Google

Combinând Ludwig Uber și T5 Google, aveți un sistem destul de puternic.

În rezumat, Ludwig este un instrument open-source auto ML care permite utilizatorilor să instruiască modele avansate fără a fi nevoie să scrie niciun cod.

Google T5, pe de altă parte, este o versiune superioară a modelelor în stil SERT. T5 poate rezuma, traduce, răspunde la întrebări și clasifica interogările de căutare, precum și multe alte funcții. Pe scurt, este un model foarte puternic.

Cu toate acestea, nu există nicio indicație că T5 a fost instruit pentru optimizarea etichetei de titlu. Dar poate putem face asta și iată cum:
  • Obținem un set de date instruit, cu exemple din:
    • Etichete de titlu originale fără cuvântul nostru cheie vizat
    • Cuvântul (cuvintele) cheie vizate
    • Etichete de titlu optimizate cu cuvintele cheie vizate
  • Un cod de reglare T5 și tutoriale de utilizat
  • Aveți un set de titluri care nu au fost optimizate, astfel încât să putem testa modelul nostru
Vom începe cu un set de date care a fost deja creat și vom oferi un ghid despre modul în care am creat setul de date.

Autorii T5 au fost suficient de generoși pentru a ne oferi un notebook Google Colab detaliat, pe care îl folosim pentru a regla T5. După ce am petrecut timp studiind-o, am reușit să răspundem la întrebări arbitrare de banalitate. Notebook-ul Colab are, de asemenea, instrucțiuni despre cum să reglați T5 pentru sarcini noi. Cu toate acestea, când vă uitați la modificările codului și la pregătirea datelor necesare, aflați că implică multă muncă și că ideile noastre pot fi perfecte.

Dar dacă ar putea fi mai simplu? Datorită versiunii 3 Uber Ludwig, care a fost lansată acum câteva luni, avem o combinație de câteva caracteristici foarte utile. Versiunea 3.0 a Ludwig vine cu:
  • Un mecanism de optimizare a hiperparametrului care obține performanțe suplimentare de la modele.
  • Integrare fără cod cu depozitul Transformers Hugging Face. Aceasta oferă utilizatorilor acces la modele actualizate precum GPT-2, T5, DistilBERT și Electra pentru sarcini de procesare a limbajului natural. Unele dintre aceste sarcini includ analiza sentimentului de clasificare, recunoașterea entității denumite, răspunsul la întrebări și multe altele.
  • Este mai nou, mai rapid, modular și are un backend mai extensibil care se bazează pe TensorFlow 2.
  • Oferă suport pentru multe formate de date noi, cum ar fi Apache Parquet, TSV și JSON.
  • Are din cutie activare de validare încrucișată.
  • Atunci când este integrat cu Greutăți și Biases, acesta poate fi utilizat pentru gestionarea și monitorizarea proceselor de formare cu mai multe modele.
  • Are un nou tip de date vectoriale care acceptă etichete zgomotoase. Acest lucru este util dacă avem de-a face cu supravegheri slabe.
Există mai multe funcții noi, dar integrarea în Transformers Hugging Face este una dintre cele mai utile caracteristici. Conductele de îmbrățișare a feței pot fi folosite pentru a îmbunătăți semnificativ eforturile de SEO pentru generarea titlurilor și a descrierilor Meta.

Utilizarea conductei este excelentă pentru a rula predicții pe modelele care sunt deja instruite și sunt deja disponibile în modelul bub. Cu toate acestea, în prezent nu există modele care să poată face ceea ce trebuie să facem, așa că combinăm Ludwig și Pipeline pentru a crea un titlu automat formidabil și Meta Description pentru fiecare pagină de pe un site web.

Cum îl folosim pe Ludwig pentru a regla T5?

Aceasta este o întrebare importantă, deoarece încercăm să arătăm clienților noștri exact ce se întâmplă în fundalul site-ului lor web. Pe aici, există un clișeu care spune: „Folosirea lui Ludwig pentru antrenamentul T5 este atât de simplă, încât ar trebui să ne gândim să o facem ilegală”. Adevărul este că am fi taxat clienții noștri mult mai mult dacă ar trebui să angajăm un inginer AI care să facă echivalentul.

Aici, veți afla exact cum reglăm T5.
  • Pasul 1: deschideți un nou notebook Google Colab. După aceea, schimbăm Runtime pentru a utiliza GPU.
  • Descarcăm setul de date Hootsuite care a fost deja pus la punct.
  • Apoi îl instalăm pe Ludwig.
  • După instalare, încărcăm setul de date de antrenament într-un cadru de date pandas și îl inspectăm pentru a vedea cum arată.
  • Apoi ne confruntăm cu cel mai semnificativ obstacol, care este crearea fișierului de configurare adecvat.
Construirea sistemului perfect necesită documentația pentru T5 și încercări și erori constante până când reușim. (ar merge un drum lung dacă puteți găsi codul Python de produs aici.)

Asigurați-vă că examinați dicționarele cu caracteristici de intrare și ieșire și asigurați-vă că setările dvs. sunt preluate corect. Dacă este făcut corect, Ludwig va începe să folosească „t5-small” ca model de rulare. Pentru modelele T5 mai mari, este mai ușor să schimbați hub-ul modelului și potențial să-i îmbunătățiți generația.

După antrenarea unui model timp de câteva ore, începem să obținem o precizie de validare impresionantă.

Este important să rețineți că Ludwig selectează automat alte măsurători cruciale de generare a textului, în principal perplexitate și distanță de editare. Acestea sunt ambele numere reduse care se potrivesc corect pentru noi.

Modul în care ne folosim modelele instruite pentru a optimiza titlurile

Punerea la încercare a modelelor noastre este partea reală interesantă.

În primul rând, descărcăm un set de date de testare cu titluri Hootsuite neoptimizate care au rămas nevăzute de model în timpul antrenamentului. Veți putea previzualiza setul de date folosind această comandă:

!cap

Hootsuite_titles_to_optimize.csv

Este foarte impresionant faptul că Ludwig și T5 pot face atât de mult cu orice set de antrenament mic și nu necesită o reglare avansată a hiperparametrului. Testul adecvat se reduce la modul în care interacționează cu cuvintele noastre cheie vizate. Cât de bine se amestecă?

Construirea unei aplicații de optimizare a etichetelor de titlu cu Streamlight

Creatorii de conținut consideră că această aplicație este cea mai utilă. Nu ar fi uimitor să ai o aplicație simplă de utilizat care nu necesită prea multe cunoștințe tehnice? Ei bine, tocmai pentru asta este Streamlight.

Instalarea sa, precum și utilizarea, sunt destul de simple. Puteți să-l instalați folosind:

! pip instalează eficient

Am creat o aplicație care utilizează acest model. Când este necesar, îl putem rula din același loc în care instruim un model sau putem descărca un model deja instruit în locul în care planificăm să rulăm scriptul. De asemenea, am pregătit un fișier CSV cu titlurile și cuvintele cheie pe care sperăm să le optimizăm.

Acum lansăm aplicația. Pentru a rula modelul, trebuie să oferim calea către fișierul CSV, care are titlurile și cuvintele cheie pe care sperăm să le optimizăm. Numele coloanelor CSV trebuie să se potrivească cu numele în timpul antrenamentului lui Ludwig. Dacă modelul nu optimizează toate titlurile, nu ar trebui să intrați în panică; obținerea unui număr decent corect este, de asemenea, un mare pas înainte.

În calitate de experți în Python, suntem foarte entuziasmați când lucrăm cu acest lucru, deoarece de obicei ne pompează sângele.

Cum se produce un set de date personalizat pentru antrenament

Folosind titlurile Hootsuite, putem pregăti modele care ar funcționa bine pentru clienții noștri, dar care ar putea fi prestabili pentru concurenții lor. De aceea ne asigurăm că producem propriul nostru set de date și iată cum procedăm.
  • Ne folosim propriile date din Google Search Console sau Bing Webmaster Tools.
  • Ca alternativă, putem extrage și datele de concurență ale clienților noștri de la SEMrush, Moz, Ahrefs etc.
  • Apoi scriem un script pentru etichetele de titlu și apoi împărțim titlurile care au și nu au cuvântul cheie țintă.
  • Luăm titlurile care au fost optimizate folosind cuvinte cheie și înlocuim cuvintele cheie cu sinonime sau folosim alte metode, astfel încât titlul să fie „dezoptimizat”.

Concluzie

Semalt este aici pentru a vă ajuta să vă optimizați automat etichetele de titlu, precum și meta descrierile. Procedând astfel, puteți rămâne în avans pe SERP. Analiza unui site web nu este niciodată o sarcină ușoară. De aceea, instruirea unei mașini pentru a ne ajuta să facem acest lucru nu numai că economisește costuri, ci și economisește timp.

La Semalt, există profesioniști care vor configura setul de date, Ludwig și T5, astfel încât să puteți rămâne câștigător întotdeauna.

Sunați-ne astăzi.

mass gmail