A Bing nagyszabású helyesírás-javítást indít világszerte

Avatar Gadam | 2021.02.14. 66 Views 0 Likes 0 Ratings

66 Views 0 Ratings Rate it

[ad_1]

A Microsoft Bing nagyszabású, többnyelvű helyesírás-korrekciós modelljei, amelyek együttesen Speller100 néven szerepelnek, világszerte nagy pontossággal és nagy visszahívással, több mint 100 nyelven működnek.

A Bing szerint a felhasználók által beküldött lekérdezések körülbelül 15% -ában van helyesírási hiba, ami helytelen válaszokhoz és nem optimális keresési eredményekhez vezethet.

Ennek a problémának a kezelésére a Bing felépítette az általa valaha készített legátfogóbb helyesírási korrekciós rendszert.

A Speller100-as és anélküli A / B tesztelési lekérdezések során Bing a következő eredményeket tapasztalta:

  • Az eredmény nélküli oldalak száma akár 30% -kal is csökkent.
  • Azok száma, amikor a felhasználóknak manuálisan kellett átformálniuk lekérdezésüket, 5% -kal csökkent.
  • A helyesírási javaslatra kattintó felhasználók száma egy számjegyről 67% -ra nőtt.
  • Azok száma, amikor a felhasználók az oldal bármely elemére kattintottak, egyjegyűekről 70% -ra emelkedtek.

Hogyan teljesítette ezt Bing? Olvassa tovább, hogy többet tudjon meg a Speller100-ról.

A helyesírás-javítás javítása a Bing keresési eredmények között

A helyesírás-helyesbítés már régóta prioritás a Bing számára, és a keresőmotor előrelépést tesz azzal, hogy több nyelvet is bevesz a világ minden tájáról.

„A Bing befogadóbbá tétele érdekében elhatároztuk, hogy a jelenlegi helyesírási javítási szolgáltatást 100 plusz nyelvre bővítjük, és ugyanolyan magas minőségi sávot állítunk be, mint amelyet az eredeti két tucat nyelvre állítottunk be.”

Hirdetés

Olvassa tovább az alábbiakban

A Speller100 piacra dobása jelentős előrelépést jelent a Bing számára, és lehetővé teszi az AI legújabb fejleményei miatt.

A Speller100 mögött álló technológiát a társaság legutóbbi blogbejegyzése magyarázza. Íme néhány fontos részlet a Bing új helyesírás-javítási technológiájához.

A Microsoft Bing Speller100 technológiája

Bing-kreditek nulla lövéses tanulás fontos előrelépés az AI-ben, amely segít a Speller100 megvalósításában.

A nulla lövéses tanulás lehetővé teszi az AI modell számára a helyesírás helyes megtanulását és helyesbítését minden további nyelvspecifikus címkézett képzési adat nélkül. Ez ellentétben áll a hagyományos helyesírási korrekciós megoldásokkal, amelyek kizárólag a képzési adatokra támaszkodtak a nyelv helyesírásának elsajátításához.

A képzési adatokra való támaszkodás kihívást jelent, ha a nyelvek helyesírását kijavítják, ahol nem megfelelő az adatmennyiség. Ez a probléma, amelynek megoldására a nulla lövéses tanulást tervezték.

„Képzeld el, hogy valaki megtanította neked, hogyan kell angolul írni, és automatikusan megtanultad a német, a holland, az afrikán, a skót és a luxemburgi szót is. Hogy ezt teszi lehetővé a nulla lövéses tanulás, és ez a Speller100 egyik kulcsfontosságú eleme, amely lehetővé teszi számunkra, hogy olyan nyelvekre is terjesszünk, amelyekben nagyon kevés vagy egyáltalán nincs adat. „

Hirdetés

Olvassa tovább az alábbiakban

A helyesírás-javítás nem természetes nyelvfeldolgozás

Bing megkülönbözteti, hogy bár a természetes nyelv feldolgozásában jelentős előrelépés történt, a helyesírás-javítás teljesen más feladat.

Minden helyesírási hiba két típusba sorolható:

  • Nem szóhiba: Akkor fordul elő, ha a szó nem szerepel az adott nyelv szókincsében.
  • Valós szó hibája: Akkor fordul elő, ha a szó érvényes, de nem illik a nagyobb kontextusba.

A Bing mélyreható tanulási megközelítést dolgozott ki a helyesírási hibák kijavítására, amelyet a Facebook BART modellje ihletett. Azonban abban különbözik a BART-tól, hogy a helyesírás-javítást karakterszintű problémaként fogalmazzák meg.

A karakterszintű probléma megoldása érdekében Bing Speller100 modelljét betanítási hibák utánzó karakterszintű mutációkkal képzik ki.

Bing ezeket a „zajfunkciókat” hívja:

„Zajfunkciókat terveztünk a forgatás, behelyezés, törlés és csere gyakori hibáinak generálására.

A zajfüggvény használata jelentősen csökkentette igényünket az ember által felcímkézett kommentárokra, amelyekre gyakran szükség van a gépi tanulás során. Ez nagyon hasznos azoknál a nyelveknél, amelyekre kevés vagy egyáltalán nem rendelkezünk képzési adatokkal. ”

A zajfunkciók lehetővé teszik a Bing számára, hogy a Speller100-at megtanítsa javítani azoknak a nyelveknek a helyesírását, amelyek esetében nem áll rendelkezésre nagy mennyiségű hibásan beírt lekérdezési adat.

Ehelyett a Bing beéri a weboldalakról kinyert rendszeres szöveggel, amelyet a rendszeres internetes bejárás során gyűjtenek össze. Állítólag elegendő mennyiségű szöveg van az interneten, hogy megkönnyítse több száz nyelv képzését.

„Ez az előképzési feladat az első szilárd lépésnek bizonyul a többnyelvű helyesírás-javítás megoldásában több mint 100 nyelv esetében. Ez segít elérni a korrekció visszahívásának 50% -át azokon a nyelveken, amelyek nulla képzési adattal rendelkezünk. „

Bár ez jelentős előrelépés, Bing szerint a visszahívás 50% -a nem elég jó. Itt jön be a nulla lövéses tanulás.

A képzési adatok nélküli nyelvek esetében a Bing a nulllövéses tanulási tulajdonságot használja a nyelvi családok megcélzásához. Ez azon a felfogáson alapul, hogy a világ legtöbb nyelve köztudottan rokon másokkal.

Hirdetés

Olvassa tovább az alábbiakban

„Ez az ortográfiai, morfológiai és szemantikai hasonlóság az azonos csoportba tartozó nyelvek között a nulla lövéses tanulási hibamodellt nagyon hatásossá és eredményessé teszi…

A nulla lövéses tanulás lehetővé teszi a helyesírás-előrejelzés megtanulását ezekhez az alacsony vagy erőforrás nélküli nyelvekhez. „

A Speller100 Bingben való elindítása az első lépés a nagyobb erőfeszítésekben, hogy a technológiát több Microsoft-termékben alkalmazzák.

Forrás: Microsoft kutatási blog



[ad_2]
Source link