A Bing nagyszabású helyesírás-javítást indít világszerte
[ad_1]
A Microsoft Bing nagyszabású, többnyelvű helyesírás-korrekciós modelljei, amelyek együttesen Speller100 néven szerepelnek, világszerte nagy pontossággal és nagy visszahívással, több mint 100 nyelven működnek.
A Bing szerint a felhasználók által beküldött lekérdezések körülbelül 15% -ában van helyesírási hiba, ami helytelen válaszokhoz és nem optimális keresési eredményekhez vezethet.
Ennek a problémának a kezelésére a Bing felépítette az általa valaha készített legátfogóbb helyesírási korrekciós rendszert.
A Speller100-as és anélküli A / B tesztelési lekérdezések során Bing a következő eredményeket tapasztalta:
- Az eredmény nélküli oldalak száma akár 30% -kal is csökkent.
- Azok száma, amikor a felhasználóknak manuálisan kellett átformálniuk lekérdezésüket, 5% -kal csökkent.
- A helyesírási javaslatra kattintó felhasználók száma egy számjegyről 67% -ra nőtt.
- Azok száma, amikor a felhasználók az oldal bármely elemére kattintottak, egyjegyűekről 70% -ra emelkedtek.
Hogyan teljesítette ezt Bing? Olvassa tovább, hogy többet tudjon meg a Speller100-ról.
A helyesírás-javítás javítása a Bing keresési eredmények között
A helyesírás-helyesbítés már régóta prioritás a Bing számára, és a keresőmotor előrelépést tesz azzal, hogy több nyelvet is bevesz a világ minden tájáról.
„A Bing befogadóbbá tétele érdekében elhatároztuk, hogy a jelenlegi helyesírási javítási szolgáltatást 100 plusz nyelvre bővítjük, és ugyanolyan magas minőségi sávot állítunk be, mint amelyet az eredeti két tucat nyelvre állítottunk be.”
Hirdetés
Olvassa tovább az alábbiakban
A Speller100 piacra dobása jelentős előrelépést jelent a Bing számára, és lehetővé teszi az AI legújabb fejleményei miatt.
A Speller100 mögött álló technológiát a társaság legutóbbi blogbejegyzése magyarázza. Íme néhány fontos részlet a Bing új helyesírás-javítási technológiájához.
A Microsoft Bing Speller100 technológiája
Bing-kreditek nulla lövéses tanulás fontos előrelépés az AI-ben, amely segít a Speller100 megvalósításában.
A nulla lövéses tanulás lehetővé teszi az AI modell számára a helyesírás helyes megtanulását és helyesbítését minden további nyelvspecifikus címkézett képzési adat nélkül. Ez ellentétben áll a hagyományos helyesírási korrekciós megoldásokkal, amelyek kizárólag a képzési adatokra támaszkodtak a nyelv helyesírásának elsajátításához.
A képzési adatokra való támaszkodás kihívást jelent, ha a nyelvek helyesírását kijavítják, ahol nem megfelelő az adatmennyiség. Ez a probléma, amelynek megoldására a nulla lövéses tanulást tervezték.
„Képzeld el, hogy valaki megtanította neked, hogyan kell angolul írni, és automatikusan megtanultad a német, a holland, az afrikán, a skót és a luxemburgi szót is. Hogy ezt teszi lehetővé a nulla lövéses tanulás, és ez a Speller100 egyik kulcsfontosságú eleme, amely lehetővé teszi számunkra, hogy olyan nyelvekre is terjesszünk, amelyekben nagyon kevés vagy egyáltalán nincs adat. „
Hirdetés
Olvassa tovább az alábbiakban
A helyesírás-javítás nem természetes nyelvfeldolgozás
Bing megkülönbözteti, hogy bár a természetes nyelv feldolgozásában jelentős előrelépés történt, a helyesírás-javítás teljesen más feladat.
Minden helyesírási hiba két típusba sorolható:
- Nem szóhiba: Akkor fordul elő, ha a szó nem szerepel az adott nyelv szókincsében.
- Valós szó hibája: Akkor fordul elő, ha a szó érvényes, de nem illik a nagyobb kontextusba.
A Bing mélyreható tanulási megközelítést dolgozott ki a helyesírási hibák kijavítására, amelyet a Facebook BART modellje ihletett. Azonban abban különbözik a BART-tól, hogy a helyesírás-javítást karakterszintű problémaként fogalmazzák meg.
A karakterszintű probléma megoldása érdekében Bing Speller100 modelljét betanítási hibák utánzó karakterszintű mutációkkal képzik ki.
Bing ezeket a „zajfunkciókat” hívja:
„Zajfunkciókat terveztünk a forgatás, behelyezés, törlés és csere gyakori hibáinak generálására.
A zajfüggvény használata jelentősen csökkentette igényünket az ember által felcímkézett kommentárokra, amelyekre gyakran szükség van a gépi tanulás során. Ez nagyon hasznos azoknál a nyelveknél, amelyekre kevés vagy egyáltalán nem rendelkezünk képzési adatokkal. ”
A zajfunkciók lehetővé teszik a Bing számára, hogy a Speller100-at megtanítsa javítani azoknak a nyelveknek a helyesírását, amelyek esetében nem áll rendelkezésre nagy mennyiségű hibásan beírt lekérdezési adat.
Ehelyett a Bing beéri a weboldalakról kinyert rendszeres szöveggel, amelyet a rendszeres internetes bejárás során gyűjtenek össze. Állítólag elegendő mennyiségű szöveg van az interneten, hogy megkönnyítse több száz nyelv képzését.
„Ez az előképzési feladat az első szilárd lépésnek bizonyul a többnyelvű helyesírás-javítás megoldásában több mint 100 nyelv esetében. Ez segít elérni a korrekció visszahívásának 50% -át azokon a nyelveken, amelyek nulla képzési adattal rendelkezünk. „
Bár ez jelentős előrelépés, Bing szerint a visszahívás 50% -a nem elég jó. Itt jön be a nulla lövéses tanulás.
A képzési adatok nélküli nyelvek esetében a Bing a nulllövéses tanulási tulajdonságot használja a nyelvi családok megcélzásához. Ez azon a felfogáson alapul, hogy a világ legtöbb nyelve köztudottan rokon másokkal.
Hirdetés
Olvassa tovább az alábbiakban
„Ez az ortográfiai, morfológiai és szemantikai hasonlóság az azonos csoportba tartozó nyelvek között a nulla lövéses tanulási hibamodellt nagyon hatásossá és eredményessé teszi…
A nulla lövéses tanulás lehetővé teszi a helyesírás-előrejelzés megtanulását ezekhez az alacsony vagy erőforrás nélküli nyelvekhez. „
A Speller100 Bingben való elindítása az első lépés a nagyobb erőfeszítésekben, hogy a technológiát több Microsoft-termékben alkalmazzák.
Forrás: Microsoft kutatási blog
[ad_2]
Source link