Майкрософт тулы машина тәржемә тәржемәсе нейронный Майкрософт НМТ Бинг

Майкрософт тулы машина тәржемә тәржемәсе нейронный Майкрософт НМТ Бинг
Нейронный машина тәржемәһе (НМТ) Был интеллект ҡулланып, юғары сифатлы яңы стандарттар машина тәржемәһе。 Ул иҫке стиль менән алмаштырыу статистик машина тәржемәһе (СМТ) Технологиялар,Технологиялар 2010-2020 Ул йылдарҙа, сифаты иң юғары нөктәһенә етә 。
СМТ менән сағыштырғанда,,НМТ бал сифатында урын ала тәржемә биреү менән генә түгел, тәржемә өсөн иң яҡшы тәьмин итә.,Бард һәм күберәк яңғырай、Күберәк кешегә оҡшаған。 Төп сәбәп шунда: был түбәнәйеү, был һүҙҙәрҙе контекста ҡулланыу һөйләмде күсереп иң тулы НМТ。 Һәм һәр береһенә бер нисә һүҙ контекстарҙа туранан-тура күҙҙәремә ҡараһаң ябай һүҙ СМТ。
НМТ моделе api үҙәге булып тора.,Һуңғы ҡулланыусылар өсөн күренгән。 Берҙән-бер айырмаһы булып тора аңлайышлы тәржемә сифатын яҡшыртыу ,Айырыуса ҡытайҙар өсөн、Ғәрәп һәм япон теле һәм башҡа。
Машина нимә ул тәржемә?
Иң оло уҡыусылар менән теләһә ниндәй машина тәржемәһе системаһын ҡулланып технологик машина янында тора йәки өҫтәмә ярҙам күләме теленә текст тәржемә ителгән, интернет-сервис。Хеҙмәт итергә була"сығанаҡ"бер башҡа телдәргә тәржемә ителгән тексы менән"маҡсатлы"теле。
Хәйер, уның концепцияһын һәм технологиялар ҡулланып тороу өсөн ябай интерфейс тәржемә машина ҡарата,Әммә бик ҡатмарлы фән һәм технологиялар,Берлектә һәм донъяның алдынғы технологиялар,Бигерәк тә тәрән өйрәнеү(яһалма интеллект),Оло мәғлүмәт,Теле,Болот иҫәпләү һәм веб-API。
2010 йыл башынан алып,Яһалма интеллект яңы технологиялар,Йәғни тәрәнлеге нейронный селтәрҙәре, шулай уҡ тәрән өйрәнеүсе булараҡ билдәле),Телмәр сифаты эшләү технологияһы кимәлгә етеү өсөн распознавание,Шуға күрә microsoft командаһында тәржемәсе, төп текст менән тәржемә технологиялары һәм бәйләнеш башҡа һүҙ распознавание,Башлап Ебәреү Өсөн Һүҙ Технологиялар Распознавание 。Тәржемә тауышлы яңы технологиялар 。
История,Төп методы ҡулланып уҡытыу сәнәғәте машина-машина тәржемәһе статистика был(СМТ)。Эш тураһында бер нисә һүҙ контекста,Алдынғы смт статистик анализ ҡулланып, баһалау эффектын яҡшы тәржемә өсөн һүҙҙәр 。2000 йылдарҙың уртаһынан алып-ә башлау,Microsoft индерелгән, шул иҫәптән бөтә эре ҡулланыу тәржемә бюроһы СМТ。
Нейронный машина тәржемәһе барлыҡҡа(НМТ)үҙгәрештәр тыуҙыра сәнғәт фундаменталь тәржемәле,Тәржемә сифатын арттырыу өсөн。2016 технологиялар тәржемә эшләй һәм файҙаланыусылар өсөн был буласаҡ икенсе яртыһында башлана, йәйелдереү өсөн 。
Нмт ике әйберҙәр ҡабул итеү һәм тәржемә SMT:
  • Тәржемә итеү тәржемә тәҡдим контон системаһы күп уҡыған ике миллион талап дочеловеческий 。
  • Икеһе лә эшләү кеүек ике телле һүҙлек,Әммә исемлеге буйынса һүҙ тәржемә итеүе ихтимал,Әммә хөкөм ҡарарына ярашлы, контекстарҙа ҡулланылған һүҙ тәржемә。
Microsoft тәржемә өсөн нимә ул?
Коллекцияһының бер өлөшө булараҡ API,Microsoft тәржемә api һәм тәржемәсе сервисы хеҙмәттәре машина текстың телмәр менән microsoft компанияһы microsoft 。
Тексты күсерергә, microsoft тәржемә
2007 йыл,Microsoft компанияһы microsoft тәржемә api текст командаһын ҡулланырға була,2011 йыл менән,Api ҡулланыу сифатына уның клиенты, ҡулланыу өсөн。Microsoft был текста уның эске api ҡулланыу киң MicrosoftTranslator。Унда аҙыҡ-түлек белешмәләр асылды. ,Команда яҡланы онлайн-коммуникация 。Бер танышым шулай уҡ аҙыҡ-түлек ала。
Microsoft йәки өҫтәмә клиенттар платформа аппаратында тәржемәсе булырға мөмкин теләсә ҡайһы сайтынан, шулай уҡ ниндәй операцион системаһы менән ҡулланған өсөн,Лингвистик һәм башҡа операциялар башҡарыу өсөн тәржемә,Мәҫәлән, распознавание теле ,Текст-в-һүҙлеген һәм телмәрҙең。
Ял стандарт технологиялар ҡулланыу ,Оригинал телендә текст бер һүҙҙәрҙең тәржемәһен биреп булмай менән маҡсатлы эшләү параметрҙары күрһәтелгән йәки аудио-сервис ебәрҙе,Һуңынан кире киткән була клиент хеҙмәтенә йәки тексты тәржемә итеү веб-ҡушымтаны ҡулланыу өсөн。
Azure хеҙмәте мәғлүмәт эшкәртеү үҙәге урынлашҡан тәржемәсе хеҙмәте microsoft компанияһы microsoft,Болот ала һәм шулай уҡ microsoft башҡа хәүефһеҙлек хеҙмәттәре,Масштабируемость,Әсбап файҙаланыуҙың ышаныслы һәм өҙлөкһөҙ。
Microsoft тәржемә тәржемәсе тауыш
Microsoft skype тауышлы технологияһы буйынса ебәрелә тәржемәсе тәржемә тәржемәсе булып башлай аҙағында 2014 ,2016 йылдың башында башлау клиенттар өсөн api ҡулланыу сифатына менән асыҡ 。Ул ваҡытта тәржемәсе microsoft реаль функциялар асыла.,Скайп,Microsoft Skype өсөн өҫтәмә Android һәм тәржемәсе йыйылышы Трансляция,iOS һәм Windows。
Майкрософт һүҙмә һүҙ тәржемә итеү,Майкрософт тауыш-был хеҙмәтләндереү үтә тулыһынса настроить,Телмәр өсөн распознавание ,Тауышлы һәм тәржемәсе ТЦ(текстың телмәр)。
Тексты тәржемә итергә, нисек эшләргә?
Төп техник текстарҙы тәржемә итеү өсөн, ике тарафтың:Традицион ысулды,Тәржемә статистикаһы машина(СМТ)технологиялар һәм киләһе быуын,Нейронный тип тәржемә машина(НМТ)。
Статистик машина тәржемәһе
Статистик машина ҡаҙаныштары өсөн Microsoft тәржемә тәржемәсе(СМТ)тиҫтәнән ашыу дауамында тикшеренеү тәбиғи теле microsoft төҙөгәндә, нигеҙендә。Хәҙерге урынына күсерә системаһы, ҡағиҙәләре яҙыу өсөн инструкция телдәр араһындағы тәржемәгә,Әммә программаларҙы үҙгәртә һәм тексты тәржемә һәм тәржемә теле булған кешеләр уҡыта булып һанала машина ҡулланырға өйрәтеү бурысы һуңғы ҡаҙаныштары араһында статистика。
Шулай тип атала"параллель корпусы"заманса күп хеҙмәт таш Розеттский,Был тематика контексында һәм күп нисә тел өсөн, һүҙ бирәләр.,Идиомаларҙы һәм фразаның тәржемәһе。Статистик моделен әҙерләү алгоритмдары һәм һөҙөмтәле ысулы, унда компьютер ярҙам ала, уҡыу хәл итеү өсөн тейешле мәғлүмәттәр араһындағы мөнәсәбәтте билдәләү һәм татыулыҡ кодты теле сиселгән теленә тәржемәһен биреп булмаймы, яңы шарт һөйләмдәрҙә табыу, һорау иң яҡшы тәржемә。Microsoft лингвистик мәғлүмәттәр менән тәржемәсе статистик ысулдар,Иң яҡшы тәржемә өсөн еңел аңлауға килтерә моделде күберәк етештерергә һәм дөйөмләштереү。
Һүҙлек йәки грамматика ҡағиҙәләре түгел, сөнки был алымдарға таянып,Шуға күрә уның яҡшы һүҙҙәренә тәржемә бирә.,Был һүҙҙәрҙе контекста ҡулланыу, ә һүҙҙең бер тәржемәһен дә үтәргә тырыша.。Тәржемә өсөн һүҙҙәр,Ике телле һүҙлектәр әҙерләп。
Нейронный машина тәржемәһе
Даими камиллаштырыу бик мөһим тәржемә。Әммә,2010 йылдың уртаһынан башлана.,SMT технологиялар, етештереүсәнлекте арттырыу торошо тотороҡло булмаясаҡ。Майкрософт Ай супер компьютер ҡулланыу арҡаһында, айырыуса когнитив функцияһы һәм Microsoft шкалаһы эшләнһә,Майкрософт тәржемәсеһен бирергә, хәҙер селтәр нигеҙендә нейронный(тәржемә ЛСТМ ,Шуға күрә тиҫтәләгән яңы тәржемә сифаты яҡшыра。
Microsoft был ҡарарға һүҙ үҙгәртеүсе категорияларҙың нейросетевой һәм моделдәр аша id ҡулланыу, бөтә телдәр өсөн api тауышлы。
Традицион менән сағыштырғанда смт,Селтәрҙәрен үҙгәртеп ҡороу өсөн төрлө ысулда башҡарырға нейронный。
Тәжрибә киләһене күрһәтә анимация селтәрендә һәр аҙым нейронный тәржемә ителгән тәржемәләр。Был ысул ярҙамында,Контекста ҡуйылыуы бөтә булған тәржемә тәҡдим итеү,СМТ методикаһы урынына, бер нисә һүҙ генә ҡулланыла тәҙрә сползать,Һәм кешенең ирекле яһарға һәм тәржемә。
Нейронный селтәре нигеҙендә уҡырға ,Бөтә буйлап 500 һүҙ-вектор мерный кодировка,Конкрет телдәр вектор пар төшөнсәләр, уның үҙенсәлектәре кеүек уникаль ҡытай һәм инглиз һәм。Уҡытыу теленә бәйле,Был азнала булырға тейеш күләменә селтәр нейронный。Мөмкин булған ҡайһы бер төшөнсәләр улар ябай кодлау,Мәҫәлән, ҡатын-ҡыҙҙар енесе,Ир-егет,Нейтраль),Әҙәплелек теле менән бер дәрәжәлә ,Түгел стесняйтесь,Яҙған,Һәм форма һ. б.,Һүҙ индерелгән: ҡылым,Исемдәрҙең һ. б.,Шулай уҡ уҡыусыларыбыҙҙың һәр береһе үҙенсәлеге аңлашыла башҡа мәғлүмәт ала.。
Хәрәкәт түбәндәгене үтәргә селтәренән тәржемә тәжрибә нейронный:
  • Һәр һүҙ,Йәки, дөрөҫөрәге, 500 белдерҙе, үҙ-вектор мерный,Барыһы аша"нейрон"беренсе ҡатлам,Башҡа тәҡдимдәрегеҙ булһа, уның һүҙе һүҙ контекста 1000-вектор b ул мерный кодлау。
  • Һуң, бөтә һүҙҙәр шул-1000 закодировать йәғни был-вектор мерный,Был эш бер нисә тапҡыр ҡабатланған,Булған тәҡдимдәр һәр ҡатлам булыуы мөмкин, контекста был көй 1000-дән ашыу нәҙек һүҙ-төшөнсә менән мерный SMT технологиялар, киреһенсә, 3-тән 5-кә тиклем word-та ғына тәҙрәгә ҡарарға мөмкин
  • Шул саҡта,Иғтибар, был ҡатлам, е. т. программалар менән тәьмин итеү алгоритмдар ҡулланыу һуңғы һығымта матрица,Һәм был иғтибар киләһе ял көндәрен билдәләү өсөн ҡулланылған һүҙҙәр ҡатламына күсерелә тәүге һөйләм күсереп кәрәк матрица элек һуңғы ял көндәрен, уларҙың һүҙ。Ул шулай уҡ кәрәкмәгән һүҙҙәрҙе ҡулланмау ҡалаһы был иҫәп-хисап ырғытып теленең потенциаль。
  • Маҡсатлы телендә эквивалентһыҙ һүҙҙәр ҡатламын күсереп теленә тәржемә декодер иң һайларға тура килгән, йәки унан конкретно,Йәғни контекста тулыһынса күрһәтеүсе фраза, - тип һүҙ 1000-вектор мерный。Шуның өсөн сығыр һуңғы һәм кире бәйләнеш буйынса тейешле ҡатлам ҡатлам,Шуның өсөн, һөйләм күсереп бирергә тейешле иҫәпләнә, унда түбәндәге һүҙҙәр。

Был миҫалдар күрһәтеүенсә анимация,Контекстно-1000 бойондороҡло-мерный моделе" "исем булды, закодировать өйө кеүек,-француз һүҙе был ҡатын-ҡыҙ йорт。Был мөмкинлектәрҙән дөрөҫ тәржемә өсөн", "булып" остом" түгел, ә" музыка "һ торған берҙән,Ир-аттар, һәм" урман "тип аталған күплектән үҙгәртеп ҡороу һуң ҡаҙаныштар кимәлен дешифратор 。
Иғтибар, был осраҡта һүҙ тәржемә бирелгән алгоритмға таянып булырмы алда" бара "иҫәпләү,Темалар һүҙ тәржемә менән йәнәш булырға тейеш," өй "урынына сифат" күк ") 。Был маҡсатҡа ирешеү сәбәп булыуы мөмкин.,Сөнки был һүҙҙәр һөйләм була аңлау өсөн инглиз һәм француз теле системаһы өҫкә тормашки。Һеҙ шулай уҡ аласыз иҫәпләнә,Әгәр сифат" ҙур" түгел, ә төҫ,Ул уны сығарырға тейеш түгел" оло йорт " =>"ля Мэзон Гранд", ә。
Был ысулды ҡулланыу арҡаһында,Күпселек осраҡта,Йомғаҡлау коэффициенты сыға СМТ-шыма ашыу тәржемә,Кеше яҡын тәржемә。
Тәржемә тауышлы, нисек эшләргә?
Шулай уҡ Microsoft тәржемә тәржемәсе тауыш。Реаль ваҡыт режимында функциялы технологиялар тәржемәсе,Ҡушымта тәржемәсе ,Skype тәржемәсе асылды,Башта тәржемәсе булып һәм skype аша ғына функциялар, өҫтәмә android һәм ios был шулай уҡ microsoft тәржемә функциональ тәьмин итеү。Azure үҫешендәге һуңға ҡалыу өсөн api ҡулланыу нигеҙендә эшләргә мөмкин версия хәҙер асыҡ биреү порталы。
Хәйер, техника кимәле технологиялар нигеҙендә төҙөлгән булған предшествующий һүҙ тәржемә тәү ҡарашҡа, ябай процесы кеүек ине.,Әммә был яһалған булырға тейеш, тип йәшәй"традицион"кеше-машина күпкә юғары булған ябай телмәр текстар бар распознавание вставляться。Тәржемә。
Шуның өсөн, булған өсөн сығанағы""дөрөҫ тәржемә иткәндә башҡа телдәр менән бер тауыш"маҡсатлы"теле,Дүрт аҙым системаһы аша үтергә кәрәк.。
  • Телмәр Распознавание ,Конвертацияланыусы текст аудио
  • TrueText:Майкрософт Технологиялар ,Нормалләштереү өсөн үҙгәртергә мөмкин, уның өсөн тәржемә эшләү өсөн кулак
  • Тәржемә өсөн текст машина тәржемәһе,Әммә реаль өсөн ҡулланылған махсус диалог төҙөп һөйләргә, үҫеш моделен сыновья
  • Кәрәк булһа, тексты үҙгәртеп ҡороу һүҙ үҙгәртеүсе,Тәржемә эшләү өсөн аудио。

Телмәр распознавание автоматик, автоматик телмәр распознавание)
Нейронный селтәре ярҙамында уҡытыу системаһы(НН)распознавание асра телмәрҙә үтәгән өсөн автоматик),Меңлек аудио система анализлау мөмкин сәғәт тауышы。Кешеләр араһында үҙ-ара эш итеү моделе төҙөлгән, ә машиналар өсөн түгел, кеше командаһы менән күнекмәләр,Шулай итеп, даими өсөн диалог, телмәр оптимизирован өсөн распознавание。Был маҡсатҡа ирешеү өсөн,Традицион менән "кеше-машина" сағыштырғанда асра,ДНН мәғлүмәтте күберәк һәм күберәк кәрәк.。
TrueText
Кеше башҡа кешеләр менән аралаша башлаған ваҡытта,Сөнки һүҙҙәр беҙҙең түгел, беҙ нисек уйлайһың, ғәҙәттә, шул тиклем идеаль,Бөхтә һәм аныҡ。Технологиялар ярҙамында TrueText ,Бетеү һүҙе айырма тауыш тултырып, мәҫәлән," аҡыл","ах","а","нисек",ҡабатлау һәм заикаться。Осоп ҡушыу юлы,Баш хәреф һәм пунктуация,Шулай уҡ һеҙ яҡшыртыу мөмкин һәм тексты тәржемә итеү ҡыйынлашты。Шуның өсөн, был һөҙөмтә бирә,Эш технологияһын ҡулланыу тиҫтә тел,Был иң үҫешкән тәржемәсе,TrueText булдырыу өсөн ҡулланыла.。Киләһе һүрәт аша реаль миҫал өсөн, стандартизация өлкәһен үҙгәртеп ҡороуҙың төрлө тасуирлаған текст бирелә truetext。

Комментарий ҡалдырырға