Hogyan működik a „MA”

Néhány évvel ezelőtt csináltam egy vicc „Avtopoeta”. Amikor azt mondom: „én” Avtopoeta „” kell érteni, hogy sok különböző csodálatos emberek részt vesznek a folyamatban. Először is, ez Yura Zelenkov a nyelvész, akinek heurisztikus szoktam építeni a fonetikus átírás. Voltak más partnerekkel, például a dolgozó neurális hálózatok segített Ilya Edronkin, a szakértő a hang technológia. De aztán az egyszerűség kedvéért elmondom a saját nevében.

Következő fogok beszélni az automatikus generációs költői szövegek, kiemelve három szempontból hatással van a szöveg az olvasó - ez az értelme, szerkezete és stílusa. Ez bomlás meglehetősen önkényes, és lehet, hogy nem tökéletes, de én választottam, mert nekem úgy tűnik, kényelmes konstrukció további nyilatkozatot ilyen feltételeket.

A jó hír az emberiség számára -, hogy a generációs jó minőségű, nem degenerált „érzékek” (pl történetek szkripteket, vagy narratívák) továbbra is a sok ember. Most a világ intenzív tudományos és technikai munka a feladata „megértés” gép szöveget. Már van egy igen jelentős előrelépés - például a gépi fordítás, - de még megérteni a szöveget (vagy, mondjuk, hogy válaszoljon a kérdésekre a szöveg) férfi még mindig sikerül jobb, mint egy számítógép (szemben, mondjuk, a játék megy vagy kép besorolás ).

Tehát nem fogok beszélni ma a kialakulását értelme, de azt mutatják, egy pár trükköt - lehetővé teszik, hogy automatikusan generál egy szöveget, amely létrehozhat az olvasó egy hamis értelmet. Másrészt, miért hamis? A mi rendszerünkben egy témát, és a szöveg-olvasó tapasztalni értelmében a tárgy csak olvasó - így értelmetlen, hogy úgy érzi egyformán valóságos.

Mi meg fogja érteni a szerkezet a - ez a rész a költészet csak hivatalossá. Először is, azt várjuk, hogy a vers sorozatából áll sorok vannak csoportosítva versszak. Másodszor, néhány ritmikus feltételnek kell teljesülnie ezeken a vonalakon. A szótag-, hangsúlyos, a szótag-tonik és más versek, ezek a feltételek megfogalmazott különböző módon, de valahogy minden jön le, hogy értékeljék a dobok és időtartamát minden szótagot. Harmadszor, eltarthat egy fonetikus közötti összhangot a különböző vonalak - van, például lehet rím vagy alliterációval.

Így, ha tudjuk (és tudjuk, hogyan) építeni egy fonetikus átírás minden sor szöveget, továbbra is tisztán műszaki feladat -, hogy írjon egy algoritmust, amely meghatározza, hogy két húr alkalmas arra, hogy egymással. Ki kell építeni a fonetikus átírás, gróf szótagok időtartamának meghatározásához mindegyik betartásának megállapítása a kívánt vonalat meter, hogy ellenőrizze a jelenlétét két sor kereszt rím. Ha van egy csomó szöveget húrok, tudjuk szűrni, és ezzel automatikusan létrehoz egy véletlenszerű halmaza megállapodott feltételek költői struktúra.

keresések

Sajátosságai miatt munkájuk, tanultam egy csomó áramlását keresési lekérdezések „Yandex” - természetes, személytelen, anélkül, hogy kötve egy adott felhasználó. Azon a napon az emberek megkérdezik: „Yandex” mintegy 300.000.000 lekérdezések, és körülbelül fele - egyedi, vagyis ne ismételje egymást.

Keresési lekérdezések lehet gyűjteni egy csomó szórakoztató: ők érdekeit tükrözik, és törekvéseit az emberek, és különben is, ez egy feneketlen kút szöveges anyag. Abban az időben, nyelvészek Yandex készült több jelentést a nyelv, amelyet az emberek használni a keresési lekérdezések. Ez a nyelv egyszerűsített, és annak íratlan szabályai nem mindig felelnek meg az orosz nyelvtan.

szabályok gyakran okozza visszajelzést: ha a keresés hosszú ideig nem tartja szükségesnek az adott kérelem, az emberek abbahagyják neki, hogy kérje és kezdenie más. Fokozatosan fejleszteni bizonyos kollektív szokás, egyfajta pidgin. Megj hatalmas építmények, mint a „néz online ingyen jó minőségű regisztráció nélkül, anélkül, hogy SMS-t». De egy ritka, alacsony frekvenciájú lekérdezéseket is láthatók egy igazi emberi élet:

  • [Ez lógnak a lakásban, hogy férjhez]
  • [Tadadadadam jégkorong dallamot]
  • [Pornó nokii 320x240]
  • [Red alsónadrág a csillár szeretni vélemény]
  • [Soha nem gondoltam, hogy ez a vb, akkor nem nyer].

strukturális kísérletek

A hét folyamán egy pár keresés kezeli milliárd lekérdezések. Köztük találjuk a vonalat bármilyen kívánt méretet: chorea, jambikus sor, és így tovább. A legelső „költészet”, ami kiváltja Avtopoet fehér volt - tettem a szűrő tekintettel méter, de nem szükségszerűen jelen rím:

közmondások, hangvilla
posztumusz érmék
mosolygós melankolikus
Elnök szimbolizmus.

Akkor „Avtopoet” tanult rím sor. Kitaláltam a legegyszerűbb algoritmus - úgy döntött, hogy hasonlítsa össze a vége a fonetikus átírását lekérdezések az utolsó szótagot hangsúlyozta. Ha véget ugyanaz, akkor feltételezhetjük, hogy a rím vonalak. Csak meg kell győződjön meg róla, hogy nem rímel egy szót is. Meglepő módon, egy ilyen egyszerű heurisztikus meglehetősen működik (bár lehet gyengült). Itt van egy egyszerű rím:

vásárolni cipő Moszkvában
Szeretném látni képeket
Game Bad Pig
filmet nézni trendeket.

Ebben a szakaszban, tettem „Avtopoeta” a belső közösségi hálózat „Yandex”. Lezuhanyozott ötlet: menjünk tanítom generál haiku, porok, sütemény, depressyashki. Az eredmények azon kísérleteink megtalálható a yandex.ru/autopoet.

anyagok kísérletek

A hirtelen érdeklődés „Avtopoetu” a közönség arra ösztönzött minket, hogy továbbra is kísérletezni a különböző megközelítések és szöveges tömbök. Kollégák a különböző szolgáltatások, „Yandex” hozza el nekünk a szöveges adatok, hogy mi rímes őket. Például volt egy rím a nevét a megállók a bázis „Yandeks.Transport” alkalmazások:

Ifjúsági Központ Magyarország
Building Industry növény
labdarúgó Akadémia
Old Market Autósiskola.

Mi reprodukálni a klasszikus és szórakoztató rímelő számokkal:

905 13 16
850 60
5700819
18.650.

Szerkezeti jellemzők hivatalossá elég egyszerű. Sokkal nehezebb meghatározni a stílus a szöveg és kezelni azt. Elég elolvasni egy személy valószínűleg képes megkülönböztetni egy vers Puskin költeménye Brodsky, még ha soha nem olvassa el ezeket a munkákat elsősorban. De hogyan lehet hivatalossá az elveket, amelyek van ilyen azonosító?

Egy példája nagy sikert ezen a területen - Prisma alkalmazás. ami sokkal tárgyalt az elmúlt években. Ez lehetővé teszi, egygombos gombot stilizálhatja az alábbi képre egy híres művész. A finomság abban a tényben rejlik, hogy a képek kezelésére használt nem klasszikus szűrők és neurális hálózat megközelítés. Az elmúlt években, azt aktívan fejlődik. Hasonló algoritmusok jelentek meg több, mint egy évvel ezelőtt, de a termék lövés Prisma, ezért adom példaként.

Hogyan működik ez? Rendkívül egyszerűsítése, azt mondhatjuk, hogy bizonyos matematikai modell (ANN) képeztek ki, hogy játsszon egy bizonyos stílust a művész. Nagyon fontos, hogy ez nem történik meg, hogy kövesse egy adott művész, és ki van képezve.

Mi ez a modell, és mutasd meg neki a sok festmény Mondrian - és elkezdi másolni az ő stílusa. Ha vesszük az ugyanazon a hálózaton, és megmutatja neki, Munch, megtanulja utánozni Munch. Nem kell megmagyarázni, mi az a sajátossága a stílus, a művész, mint Munch eltér Mondrian. Csak mutatni a különböző képeket a neurális hálózat, míg ő nem fogja meg a lényeget.

de világít a hajnal, és hirtelen megvilágított
A hajnal még dohányzik
A lemezeken a tenger felett a patak hold
az ég vizei, de egyik sem túl hamar
a hűvös fák és sövények hladnoy
berkeiket látnok nem ejti
minden csak reagáló öröm kebelén

nekem
egyáltalán
úgyhogy egy álom
egyre közelebb

és én
Soha nem mondom
Nem tudom, hogy hol

hol van a vágy
Szeretnék meghalni az éjjel
Most reggel, bár

a fedélzeten olyan területeken, ahol nincs Shisha
ünnepe a kő, mintha a jászolban
Lementem az útvonala a kiterjedésű
egy hatalmas állkapocs, a torok érvelve
víz leég nélkül felhajtás
De egy pillanatra minden háború
ott játszani, és a hibás
egy nagy szálloda a többi ház
az örök nő valaha is volt
Egy üres öbölben, mintha a tornácon
és hogy minden földet ért
csak két földek egy álom

Meg lehet próbálni, hogy automatikusan felismerje a munkálatok néhány költő már képzett neurális hálózat biztosítja ezeket a részeket. Persze, általában a szöveg emlékeztet shizofaziyny értelmetlen, de mi már beszéltünk a jelentését. Meg kell, hogy értékelje a stilisztikai komponenst.

Szerkezete és stílusa

Tehát van a szerkezet és stílus. Csináljunk őket. Mint azt bizonyára észrevették, a hálózat nem tanult rím a saját vonal, bár a költői dimenzió tartja elég jól. Ő könnyű segíteni hozzáadásával heurisztikus, amiről már korábban leírtuk. És kérte, hogy létrehoz a szöveget a stílus Puskin:

és nézd zavarban is váratlan
raliban a mondatot
az összes érzék az állandó
én hűvös énekes és tolvaj

Nem, nem tudom, hogy nem kérdez
de nem volt legyőzni lélek
ha nem olvassa el, és akkor nem hagy
vastag időnként egy szökőkút

akikkel elvesztette veletek
ahol a mezők becsomagolt limes
és sírunk róluk szenvedett
a nyugati a fény világít

Nagyon jó volt merészség
mint egy hattyú egy olyan területen kimerült

Vajon elég egy műalkotás megfelelés szerkezete és stílusa? Zene - úgy tűnik, hogy elég. És a szöveg?

Vizsgálataink szerint, így még túl korai, hogy komolyan aggódni a szakma, és a számítógépes szakértők tennivalója. Most automata szövege hiányzik a szerkezeten keresztül, a szemantika -, de a képek már elég magas ahhoz, hogy ahogy olvasod kipróbálhatja magát, hogy jöjjön ki valami értelme, akkor is, ha nem. Most képzeljük el, hogy egy vagy két év lesz „Prisma szövegek”, és minden tanuló írásban néhány mondat, nyomja egy pár gomb, hogy kezelje őket „a Csehov,” vagy „alatt Lermontov”.

Röviden, Yandex-transleyt technikailag működik még rosszabb, mint a Google-transleyta, és a tartalmát mindkét nem hasonlíthatók össze a szótárban. Yandex-transleyt segíthet megérteni a leggyakoribb értelmében a cikket egy külföldi honlapon. Yandeks.Slovari segített, hogy "Lord of the Rings", "A Gyűrűk Ura". Zárás a szolgáltatás - a fájdalom több ezer hivatásos fordítók és nyelvészek több tízezer rajongó. És nem számít említett transleyt és egyéb források alkalmazottak Yandex, a valóság az, hogy a megfelelő csere nem áll rendelkezésre. Egyszerűen nem létezik sehol.

Mire jó egy általános szolgáltatás, amely még kifejezéseket lefordított szó? „Rain macskák és kutyák”, mi, mi?
Szótár fordítása helyes.