Kognitivt system IBM Watson: Principer att arbeta med naturligt språk. Hur IBM Watson kognitivt system fungerar


) - En IBM superdator utrustad med ett artificiellt intelligenssystem, som skapades av en grupp forskare under ledning av David Feruchchi. Dess skapelse är en del av DeepQA-projektet. Watsons huvuduppgift är att förstå de frågor som är formulerade på naturligt språk och hitta svar i databasen. Namngiven till ära av grundaren av IBM Thomas Watson.

Deltagande i "Jeopardy!"

I februari 2011, för att kontrollera Watsons möjligheter, deltog han i Teleow Jeopardy! (Rysk analog är ett eget spel). Hans rivaler var Brad Ratter - ägaren till den största vinsten i programmet och Ken Jennings - rekordhållaren på varaktigheten av Win-Win-serien. Watson vann, fick 1 miljon dollar, medan Jennings och Ratter mottog respektive 300 och 200 tusen.

Plattform

Watson består av 90 Power7 750 servrar, som alla innehåller 4 åttaåriga Power7-processorer. Watsons totala driftsminne är mer än 15 terabyte.

Systemet har tillgång till 200 miljoner sidor av strukturerad och ostrukturerad information i 4 terabyte, inklusive full Wikipedia-text. Under spelet hade Watson inte tillgång till Internet.

Framtida projekt

IBM tillsammans med nyansekommunikation planerar att utveckla en produkt de närmaste två år som syftar till att hjälpa till att diagnostisera och behandla patienter. Diskuterar också möjligheterna att använda på andra områden, såsom bedömning av försäkringar eller energieffektivitet.

Historien om Watson började 2006, när David Feruchchi, ledande befattningshavare för IBM-avdelningen för semantisk analys, tog upp testningen av en av de mest kraftfulla superdatorerna i företaget, som ockuperade en av de översta linjerna på de 500 mest produktiva Maskiner i världen. Feruchci bestämde sig för att försöka hur effektivt bilen skulle klara de uppgifter som ställts av "naturligt språk" och föreslog att hon svarade på 500 frågor som anges i de redan beställda Jeopardy-programmen! Resultaten var katastrofala: Jämfört med levande spelare, var bilen otillräckligt "tryckt på knappen" (det vill säga det var klart för svaret), och i det fall då hon fortfarande kunde konkurrera med människor, överskred inte antalet korrekta svar 15%

Feruchci blev intresserad av orsakerna till ett sådant superdatorbeteende och som ett resultat 2007 kunde det övertyga IBM-ledningen för att ge honom ett team på 15 personer och från 3 till 5 år för att skapa ett effektivt automatiskt system som kan svara på informaliserade frågor . Ett sådant system skulle vara användbart för alla typer av callcenter, referens och andra tjänster som betjänar kunder. IBM hade en lyckad erfarenhet av att skapa en bil som skulle kunna argumentera med mänsklig intelligens - vi pratar om den djupa blå superdatorn, som 1997 vann världsmästaren av schackarry Kasparov. Denna seger gjorde bra IBM-reklam, men det var inte möjligt att hitta en kommersiell användning av denna installation. När det gäller systemet med automatiska svar på frågor är kommersiell potential ganska uppenbart.

Den grundläggande skillnaden i Watson från djupblå är att om schackmaskinen behandlar strängt logiska regler i spelet, är maskinen som erkänner det "naturliga talet" inför mycket mer komplexa regler och många snedvridningar och avvikelser från dem. Men den största svårigheten ligger i det faktum att människor själva inte inser, kommunicerar inom sitt kulturella och sociala sammanhang. I vardagligt tal, fullt av tips, allusioner och konnotationer, hänvisning till vissa vanliga för en viss offentlig miljö, begrepp och fenomen. Bland deras religiösa åsikter, och politiska övertygelser, och alla slags konstverk - från böcker och målningar till filmer och dataspel.

För effektiv behandling av sådan information används statistiska algoritmer, vilket möjliggör analys av en mängd olika dokument för att upprätta en koppling mellan olika begrepp med varandra. Enkelt uttryckt bestämmer det vilka ord som oftast används tillsammans. Till exempel är "Kreml" oftare förknippad med orden "Ryssland", "Moskva", lite mindre än oftare med Kazan, Nizhny Novgorod, ännu mindre - med "katedral", "ikon", etc. Även om dessa Algoritmer kända för länge sedan, för att fullt ut tillämpa dem var det endast möjligt under det senaste decenniet - efter kardinalväxten av utförandet av datorutrustning och reducera kostnaden för lagringsenheter för att lagra stora datarrayer.

Feruchchi-laget hämtar miljontals av alla typer av dokument till IBM Watson - läroböcker, encyklopedi, referensböcker, konstnärlig och religiös litteratur. För att analysera problem används mer än hundra algoritmer med hundratals möjliga lösningar samtidigt. Därefter utvärderar andra algoritmer noggrannheten av potentiella svar, som är omöjliga på grund av objektiva skäl (till exempel inkonsekvenserna för evenemangsdagen och de aktörernas års ålder) och osannolikt. Ju mer samma svar mottas, desto högre är sannolikheten för att de är korrekta - i spelet i spelet, visas en rating från flera av de mest sannolika svaren på resultattavlan, förutom att oftast förekommer.

Vid 2008 flyttade IBM Watson från utsläpp av "förlorare" till de översta linjerna i de så kallade "vinnarna moln", som består av människor, i 50% av fallen av framgångsrik till den första att trycka på en knapp, signalerar om beredskapen att svara och sedan i 85-95% av fallen att ge rätt svar. IBM kom även överens med Jeopardy-producenter hösten 2010 en speciell serie av spel med Watson och vinnarna under de senaste åren. För att förbereda sig för dessa spel (det vill säga det ungefärliga interiören i Quiz-studion återskapades) och testen genomfördes med deltagande av levande spelare och ledningen. Samtidigt, som det borde vara, "Watson" ger sina svar på högt en syntetiserad datorröst än mycket att ha kul att delta.

Under "utbildning" visade det sig vara ett anställt faktum: trots att Watsons hela potentialen inte bara kan vinna majoriteten av spelen, men också spela mer än hälften av dem. Det finns flera anledningar: från "Hans Majestätfall" (det finns situationer där motståndaren kan vinna, bara höja spelen, lämna bilen med konkurs) till reglerna. Otroligt nog, men en person kan trycka på knappen snabbare än maskinen, och det beror på spelreglerna som inte kan ändras.

Faktum är att varje fråga visas på skärmen och läser ut av ledningen, och du kan bara klicka på knappen först efter slutet av att läsa frågan. Watson får texten till frågan i elektronisk form samtidigt med sin produktion på skärmen, men även samtidigt har det inte dags att komma till den färdiga lösningen på den snabbaste människan. Medan värden läser frågan, som spenderas sex till sju sekunder, kan en erfaren spelare redan utvärdera sina chanser att ge rätt svar och redo att klicka på knappen för några tiotals millisekunder. För ett efterföljande svar avvisas reglerna i fem sekunder.

Genom att trycka på knappen, riskerar personen: Om han inte ger rätt svar på frågan för 100 enheter, kommer det virtuella kontot att tömma samma belopp. Datorn är inte benägen att riskera och ger endast svar efter alla beräkningar och endast om den har tillräckligt med information för att bedöma tillförlitligheten och sannolikheten för att detta svar är korrekt. Hur det ser ut i spelet i spelet kan du se på besökaren. Risk, en levande spelare kan vinna på grund av att han kommer att komma ihåg det önskade svaret för 11-12 sekunder till sitt förfogande.

I en något mer formaliserad situation än en tv, kan Watson-algoritmer ge mycket mer förutsägbara och korrekta svar. I synnerhet avser chefen för IBM-forskningsenheten John Kelly att skapa en medicinsk version av den här enheten under det inofficiella namnet Watson M.D. Ett sådant system skulle hjälpa läkare att snabbt göra rätt lösningar, med beaktande av den stora uppsättningen patientdata, vilket är fysiskt omöjligt att alltid hålla i minnet. "Watson" kan väl ersätta levande operatörer i dator- och telefontjänster i detaljhandeln, inom banksektorn och transport.

Kostnaden för IBM Watson Class-systemet kommer att bilda flera miljoner dollar, eftersom det kräver minst en IBM superdator för sin verksamhet för en miljon dollar. Kelly tror att den närmaste tio åren kan genomföras på en mycket billigare server, och i perspektiv kommer ett sådant program att fungera på en dator inte mer än en modern bärbar dator.

Att veta engelska kan slåss med IBM Watson online på New York Times hemsida.

IBM Watson superdatorn är planerad att användas i tekniska supporttjänster istället för levande operatörer. Men alla dessa uppgifter är ganska förknippade med att hitta rätt svar på användarförfrågningar baserat på välkänd information. IBM tror att verklig artificiell intelligens borde kunna hitta kreativa lösningar, skapa och uppfinna en ny, och inte bara analysera den gamla.

För utvecklingen av kreativa förmågor av Watson valde dess skapare kulinarisk konst. Detta är ett mycket bekvämt testpolygon: matlagning är en mycket "mänsklig", en intuitiv process, svagt magert algoritm och standardisering. Och någon person från gatan kan utvärdera resultatet. Mandel-chokladkaka i spansk stil, jordgubbar efterrätt ecuadorian, tomater grillad grill med saffran - dessa och andra rätter skapade av Watson har redan varit beredda och är glada att ätas under experimenten. För några veckor sedan publicerades en förtryck av artikeln med en beskrivning av algoritmer och matematiska modeller som Watson använder för att skapa ursprungliga recept.

Eventuellt kreativt beslut bör samtidigt uppfylla två kriterier - att vara nytt och bättre. Nyhet uppnår relativt lätt, helt enkelt kombinera ingredienser och bearbetningstekniker. Men med kvalitet är det mycket mer komplicerat. Lär en dator för att förstå vad som kommer att smaka, arom, textur och utseende av skålen är extremt svårt.

De ursprungliga uppgifterna för Watson serverade flera miljoner recept som samlats in på Internet. Det missades genom beprövade naturliga språkbehandlingsalgoritmer som användes för seger i quiz och att träna Watson Medicine. Från Wikipedia extraherades information om typiska ingredienser och bearbetningstekniker som är karakteristiska för köket av olika människors folk. Slutligen fick Watson grundlig kunskap i kemi och fysiologi av uppfattningen av en smak och lukt.

Nya recept genererades på grundval av befintlig med en genetisk algoritm, värdena för nyhet, trevlig och kompatibilitet användes som en funktion av fitness.

Den matematiska modellen för Receptnyhetsbedömningen är baserad på Bayes Theorem, den så kallade "Bayesov överraskning" -metoden användes, ursprungligen utformad för att simulera betraktarens beteende när du tittar på en video. I ett nötskal är kärnan i metoden att skillnaden mäts mellan en priori och astrarisk sannolikhet för att möta en viss kombination av produkter i receptet när de lägger till det nya. Så, kombinationer av nötter med choklad eller senap med korv är helt banala och orsakar inte nästan ingen förändring i sannolikheten för olika kombinationer. Men korv i choklad kommer att påverka dessa sannolikheter mycket mer väsentligt.

Att bedöma den trevliga användningen som används huvudsakligen. Att veta produktens kemiska sammansättning och storleken på deras blandning och bearbetning, beräknade datorn vilka ämnen som bestämmer smaken och lukten av maträtten. Intressant visade lukten vara mycket viktigare än smaken av rätter. Vår uppfattning om smak är mycket starkt förknippad med lukt och arom. En person skiljer bara några grundläggande smaker - sur, söt salt, bitter. I olika kulturer finns det fortfarande flera grundläggande smaker, såsom tårta eller sinne. Men diversiteten av lukt är mycket mer och de är inte reducerade till enkla grundläggande kombinationer.

Slutligen har utvärderingen av kombinationen av produkter också åberopat en seriös vetenskaplig bas, särskilt på en gemensam studie av amerikanska och brittiska forskare "-nätverk och principerna för kombinationen av produkter", där cirka 50 000 recept var Analyseras och kombinationskartorna över produkter byggdes, karakteristiska för kök av olika regioner.

Som ett resultat skapades en ansökan där du kan ställa in en uppsättning produkter, en nationell stil och en typ av maträtt, varefter Watson utfärdat en uppsättning recept som kan strömlinjeformas enligt graden av nyhet, trevlig och kompatibilitet. Förutom enskilda rätter vet Watson hur man skapar hela menyer, som söker mångfald och korrekta kombinationer av rätter på grund av användning av tematisk modellering. Detta är ett sätt att bygga en modell av en samling textdokument som bryter insamlingen om ämnen och bestämmer vilket ämne varje dokument avser. Watson tillämpar denna modell till recept - separata ingredienser fungerar som nyckelord, som dokument - de receptna själva.

Det sätt som modern teknik fungerar är ofta svårt, och när det gäller kognitiva beräkningar och IBM Watson verkar det som om detta ämne inte är tillgängligt för att förstå den vanliga personen. Men det här är inte alls: Professionella kan förklara allt, inklusive den mest komplexa materien och ganska tillgängliga ord. IBM-specialister berättas idag om arbetet i IBM Watson-kognitiva systemet och andra innovativa lösningar av företaget. Detta är Vladimir Alekseev, en IBM-affärskonsult i Ryssland och CIS, Alexander Dmitriev, ledande systemarkitekt IBM i Ryssland och CIS, och Julia Pakina, IBM Business Development Manager i Ryssland och CIS.

IBM har arbetat inom området kognitiv teknik i många år. Vänligen berätta för mig vilka projekt som är företaget i den här riktningen nu?

Alexander Dmitriev

För att svara på den här frågan måste du berätta lite om tekniken själva. Kognitiv teknik är utvecklingen av konstgjorda intelligenssystem, vars huvudsakliga uppgift är att hjälpa en person att fatta beslut i en svår situation. Det finns ett antal branscher och processer som kräver ledning med en stor mängd förändrade parametrar, komplexa beroenden, svårskaliga resultat. Samtidigt bör lösningar tas i tid nära den verkliga. Det enklaste exemplet är elektroniskt handel på börsen eller köp via Internet. Till exempel hålls kampanjer ofta på populära handelswebbplatser när en billig produkt är inställd till försäljning från en viss tidpunkt. En person har inte tid att ens trycka på knappen, och varorna säljs redan: Automatiska upphandlingssystem utlöses. På samma sätt upprätthålls köp och försäljning av aktier på utbyten av beteckningar av system som samlar en stor mängd information från olika källor och "automatiskt" beslutsfattare om inköp eller försäljning av vissa insatser. Faktum är att beslutet tar en person när man skapar och lär det här systemet.

Från allt detta innebär en förståelse för spektrumet av kunder och möjliga projekt för vilka kognitiva tekniker är lämpliga: det är främst stora företag från de grenar av verksamheten, där det är nödvändigt att snabbt och effektivt bearbeta stora mängder data, identifiera komplexa band och Beroende och på algoritmer nära mänskligt tänkande, att producera lösningar, så att hantering av experter snabbt kan göra ett val av nödvändiga åtgärder. Detta är främst stor produktion, där stora resurser och datamängder är inblandade - både från tekniska system och personalåtgärder (oljeindustri, banker, konstruktion, tungteknik, etc.). Det här är de områden där mastering och förståelse för ett stort antal information om nya utvecklingar, redovisar ackumulerad erfarenhet och höga risker när man fattar beslut. Detta hänvisar till området för medicin, social ledning. Priset för medicinska lösningar är mänskligt liv, hälsa. Här är kognitiv teknik särskilt värdefulla. De tillhandahåller specialister med refererande information om nya prestationer inom specifika medicinska riktningar, hjälper till att välja det bästa behandlingsalternativet för varje patient, med hänsyn till historiens historia och specifika sjukdomar.


Dessutom är ett av de viktigaste områdena skapandet av kunskapsdatabaser på ett visst område av vetenskap, teknik, naturens natur, historia etc.

Nu om specifika projekt. Idag skapar ett antal stora företag redan komplexa lösningar för att stödja beslutsfattandet, och inte bara utomlands utan även i Ryssland. Om vi \u200b\u200bpratar om främmande exempel skapade det största australiensiska oljebolaget Woodside kunskapsbasen i sin bransch, med beaktande av sin egen erfarenhet. Detta gjorde det möjligt att lösa ett antal komplexa uppgifter - först och främst ökar personalens effektivitet, avsevärt påskynda träningscykeln, gjorde det möjligt att använda och replikera erfarenheterna från de redan genomförda projekten. Här är en enorm spara pengar över ett stort företag.

Ett ryskt exempel kan betjänas genomförandet av ett system för att arbeta med stora volymer av texter i vinkänslor, där teknik framgångsrikt implementeras på grundval av Watson Explorer. Detta system kommer att bidra till att behandla olika strukturerade och ostrukturerade uppgifter för att identifiera korrelationer mellan indikatorer som karaktäriserar tematiska områden av vetenskaplig forskning i Ryssland.

Det fanns ett annat projekt som genomfördes gemensamt med det ryska centrumet för studier av den allmänna opinionen om de internationella förbindelserna. Mer än 55 tusen texter från öppna källor analyserades med Watson-kognitiv teknik för att fördela viktiga punkter i kulturella och sociala förbindelser mellan Ryssland och Sydkorea.

Ett antal pilotprojekt inom medicinområdet baserat på Watson Health-produkten görs också, och resultaten visar gott om möjligheter att förbättra kvaliteten på patientbehandlingen.

Det måste sägas att riktningen av kognitiv teknik fortfarande är mycket ny, och därför finns det nya kunder från olika områden nästan varje dag, och vi väljer de nödvändiga verktygen från hela IBM-spektret av lösningar för dem.

Berätta för mig, tack, vad som ursprungligen var IBM Watson och varför bestämde detta system att använda sig av sådana områden som medicin, företag, försäkring?

Julia Pakina

Den allra första Watson-utgången till ljuset var 2011 på spelet Jeopardy! Då var Watson ett stort komplex av olika program, som var sammansatt speciellt för det här spelet, och de möjligheter som läggs i den vid den tiden syftade till att förstå det naturliga språket. För att göra detta var det för det första att översätta röst till texten och för det andra att korrekt tolka det resulterande textmaterialet. Således visste systemet initialt hur man tolkar texten, demontera frågorna och "förstå" deras mening. Naturligtvis är Watsons nivå och prestanda mycket högre än 2011.

Vad mer kunde då Watsonsystemet? Sök svar på en viss fråga i djupet av information som läggs i den. Den särpräglade förmågan hos det systemet var att den inte var ansluten till externa källor - inte till Internet, eller något annat. Vad som låg i hennes minne, det användes. Det mest intressanta är att tack vare den lilla logiken rankade systemet möjliga alternativ för svar och utfärdat den där det tack vare sin logik var säker som så korrekt som möjligt. Under 2011 vann Watson-systemet med en stor marginal av andra deltagare - människor, separationen där var allvarlig. Och efter det här spelet var det en fråga: "Vad är nästa?"


Spelet är bra! Men vad kan vara den vidare användning av systemet? Därefter började experter tänka på var Watson-teknik kan användas kommersiellt, i vilket verksamhetsområde, på vilka marknader. IBM har bestämt att Watson behöver användas där det finns en stor ström av textuell ostrukturerad information på ett naturligt språk, och där en person behöver en intellektuell assistent. Och vi började arbeta inom hälsosektorn. Saken är att Watson, som vi redan vet, kan hantera en stor mängd information. Och till exempel 500 tusen nya vetenskapliga artiklar på olika områden och forskningsområden visas årligen i onkologi. Och det är uppenbart att en levande person inte kan klara av en sådan informationsaxel. Men trots allt kan nya material på detta område inte ignoreras, de måste behandlas intellektuellt, väga, jämföra, vända sig till den tidigare upplevelsen.

Samtidigt är det nödvändigt att ta hänsyn till att allt som Watson nu vet, det lades i begåvade programmerare, lingvister, experter från ämnesområden.

Vad är din vision om framtiden IBM Watson? Till exempel, vilka uppgifter systemet kan bestämma efter 5-10 år? Vad hon inte kan göra nu, men snart planerar företagets experter att lära det?

Alexander Dmitriev

Lead System Architect IBM i Ryssland och CIS

Framtiden är ganska svår att förutsäga, inte konstigt att de flesta specialister, berättar om moderna lösningar, använder frasen "i den moderna snabbt föränderliga världen." Situationen är verkligen mycket snabbt och ofta oförutsägbart förändringar, men de viktigaste trenderna på området för kognitiv teknik är ganska tydliga.

Först och främst är det skapandet av stora kunskapsbaser på privat och statsnivå. Nu är alla världens ledande länder. De strävar mycket aktivt efter att montera, bearbeta och sätta ett system för fördelning av värdefull information från ett brett utbud av källor. Vi ser att denna process går på två huvudnivåer. Först, på nivån av stora företag av internationell betydelse som har hundratusentals anställda, filialer i olika länder och komplex produktion. Här är huvudmotorn att erhålla en konkurrensfördel. Det är uppenbart att projekten av denna nivå kräver allvarliga investeringar, men de börjar omedelbart betala omedelbart, vilket ökar effektiviteten i arbetet. Tyngdpunkten läggs på en prediktiv analys, som tillhandahåller Watson Technologies: kontrollen är inte efter genomförandet av vissa händelser, men med beaktande av erfarenheterna av bolagets arbete i prediktionsläge. En högre nivå är statens nivå när ackumulerings- och bearbetningssystemen skapas på landets skala och information från andra länder. Dessa är områden som är förknippade med utvecklingen av vetenskap, teknik, hälsa hos nationen, social ledning.

Watson har redan behärskat yrket av kock, doktor, finansierare och översättare. Vilka andra yrken ska hon behärska inom en snar framtid?

Alexander Dmitriev

Lead System Architect IBM i Ryssland och CIS

När det gäller "yrken" Watson, så finns det två aspekter. Den första är att expandera utbudet av möjligheter inom de redan behärskade yrkena. Låt oss säga inom medicin, Watson används vid behandling av ett antal onkologiska sjukdomar. Men medicinens specificitet är att inte bara de typer av sjukdomar som finns en stor mängd, men patienterna själva kännetecknas av personliga egenskaper och berättelserna om deras sjukdomar. Därför beror utvecklingen på både ökning av spektrum av helande sjukdomar och på grund av möjligheten att utveckla en alltmer detaljerad personifierad behandling för en viss patient.

Den andra är "mastering" av andra yrken. Watson har redan "behärskat" specialiseringen av oljeindustrin: ett antal utländska företag har genomfört lösningar för att stödja beslutsfattandet för sina specialister för oljeindustrin. En annan lovande riktning är att arbeta med sociala grupper och befolkningen. Dessa är områden där information behövs och produktion av tjänster och förslag till stora klientgrupper (hundratusentals och miljoner människor). Således är de omedelbara utsikterna för utveckling yrken från bankindustrin, telekommunikation, där databeloppet är otroligt stort, och lösningarna måste vidtas i realtid.

Om vi \u200b\u200btalar som helhet antar jag att Watson snart kommer i form av en tjänst bara till varje person - det kommer att vara möjligt att ställa en fråga i nästan alla intresseområden som intresserar och få ett kvalificerat svar.

Julia Pakina

IBM Business Development Manager i Ryssland och CIS

Av de senaste områdena där IBM Watson tillämpades kan du nämna mineralgruvor. Alexander har redan nämnt ett bra exempel på framgångshistoria - det australiska Woodside Energy Company, som det kognitiva systemet hjälpte att arbeta mycket mer effektivt genom att optimera arbetsflödet. Innan Watson har Woodside Energys borrbeslut gjordes på grundval av ett långt och noggrant arbete med samlingen av all möjlig dokumentation inom tekniken, inklusive den geologiska strukturen i orten, tillgången på brunnar nära, typ av insättning, förmåga att Använd den utrustning som behöver tillämpas på detta projekt.

Dessutom upptog denna förberedande period upp till 80% av bolagets tid. Följaktligen kvarstod endast 20% av tiden för att utveckla själva brunnen. Nu, tillsammans med Woodside Energy, har vi uppnått att endast 20% av tiden betalas till forskning och förbereda sig för borrning, och allt annat är allokerat för att borra och utveckla nya brunnar.

Nu pratar många företag om sin utveckling inom artificiell intelligens. IBM talar om en kognitiv plattform. Snälla berätta vad är funktionen av IBM-kognitiva tjänster och är det möjligt att kalla dem en viss typ av artificiell intelligens?

Alexander Dmitriev

Lead System Architect IBM i Ryssland och CIS

När det gäller artificiell intelligens skulle jag inte ge för mycket betydelsen av terminologi. Medan vetenskapen som helhet inte helt förstår metoderna för mänskligt tänkande (och i det här området finns det fortfarande många vita fläckar), det är opraktiskt att argumentera, vilket är en artificiell intelligens och det är inte. Det kan sägas att Watsonsystemet 2011 "passerade" ett litet modifierat formellt Turing-test till rätten att kallas artificiell intelligens. Den totala testidén är enkel: Om en person, som kommunicerar med ett system och frågar henne ett antal frågor i fri form, inte kan särskiljas, kommunicerar han med en person eller med ett maskinsystem, så kan ett sådant system hävda titeln på "artificiell intelligens".

Efter att ha vunnit Jeopardy-spelet, där det var nödvändigt att svara på frågor från olika kunskapsområden, Watson före levande deltagare och tog detta test. Men det är inte poängen. Oavsett hur vi kallar kognitiv teknik är det viktigt att de uppfyller sin huvuduppgift, bli en "förstärkare" i sinnet när de fattar komplexa beslut, både operativa och strategiska. Mänskligt minne är inte obegränsat, utbildningen av kompetenta specialister i någon bransch är dyr och långsiktig. Kognitiva system, som det var, skapar sådana virtuella konsultspecialister, vars tjänster kommer att kunna kontakta varje. Detta är kärnan i artificiell intelligens. Det är viktigt att det slutliga beslutet om eventuella problem fortfarande kommer att få en person.

Julia Pakina

IBM Business Development Manager i Ryssland och CIS

Ja, i allmänhet är det kognitiva systemet bara skapat för att ta bort rutinen och ge mer tid för kreativitet, lösa komplexa uppgifter och skapandet av nya system. Därför talar vi om att lösa icke-artificiell intelligens, men förbättrad intelligens, extra intelligens.

Vänligen berätta mer om användningen av kognitiv teknik i affärer.

Alexander Dmitriev

Lead System Architect IBM i Ryssland och CIS

Användningen av kognitiv teknik i verksamheten syftar till att lösa en rad olika uppgifter som inte bara är med stora volymer av snabbt förändrade data, men med behovet av att snabbt extrahera den nödvändiga informationen från dessa data och använda den för företag, med hänsyn till industrin och dess egna företags erfarenhet. Således är de kognitiva systemen anslutna till en mängd informationskällor (bolagets egna databaser, Internet, streaming video, information från tekniska sensorer av olika system, data om händelser i ett område eller annat). Redan på grundval av dessa data finner kognitiva system för specialalgoritmer rätt beslut och erbjuder dem chefer och specialister.

Det är viktigt att med ackumulering av erfarenhet och framgångsrik verksamhet i ett visst område kan kognitiva system utbildas, anpassas, såväl som att ställa in självutlärningsreglerna. Därför har kognitiva system för företag en viktig kvalitet som inget annat system inte har: ju längre de arbetar, ju högre deras effektivitet. De själva blir mer värdefulla för företaget under drift. Och det är viktigt att denna ackumulerade erfarenhet är tillgänglig för företagets anställda och ständigt, som används, upprepade gånger, alltid när det behövs. Den vanliga situationen - en specialist kvar, för företaget är förlorat sin personliga kunskap och erfarenhet. Med ett inbäddat kognitivt system kvarstår all erfarenhet i företaget och kan enkelt överföras till andra specialister.

Vad kan vara användbart för affärsblockchain? Nu säger de att denna teknik kan förändra den vanliga världen av entreprenörskap. Är det sant, och om så är fallet, vad är dessa förändringar?

Vladimir Alekseev

De första åsikterna om hur tekniken kan förändra entreprenörsvärlden reducerades vanligtvis till skapandet av peer-to-peer-nätverk, det vill säga en miljö där varje företag direkt kan interagera med någon annan utan några mellanhänder. Det måste erkännas, det här är för förenklad beskrivning, och med tiden har tanken utvecklats och kompletterat. Nu kan vi säga att blockchain, för det första tillåter dig att säkerställa ett distribuerat ansvar, vilket är oerhört viktigt om vi har flera företag som inte starkt litar på varandra och inte på något sätt sammankopplats. För det andra genomföres transparensen i utförandet av alla operationer och omöjligheten att göra förändringar i de transaktioner som redan genomförts. Under transaktionen förstås inte bara en banktransaktion, men mer är det faktum att överföringen av en tillgång från ett företag är annorlunda. För det tredje är det möjlighet att använda smarta kontrakt för företagslogik, nämligen tillhandahållande av hela verksamhetsprocessen. I annat fall kunde blockchain endast användas som lagringssystem, och all operationslogik för att göra utanför sin ram, vilket inte skulle ge öppenhet eller driftsäkerhet.


Finns det några positiva exempel på att använda blockchain av kommersiella företag?

Vladimir Alekseev

Företagskonsult för IBM Industrial Solutions i Ryssland och CIS

Under det gångna året genomförde IBM mer än 400 piloter i världen i olika branscher tillsammans med kunderna. Detta är givetvis finanssektorn och detaljhandeln och energi. I synnerhet pilotprojekt med ABN AMRO inom finansiell omstrukturering och fastighetsförvaltning. Med Bank of Tokio-Mitsubishi slutfördes ett projekt om användningen av Blockchain-teknik för att automatisera outsourcingkontrakt i den.

Det är ganska tidigt att prata om de praktiska resultaten av genomförandet (kvantitativa företagsindikatorer): Blockchain är fortfarande en ny teknik som också kräver tid för testning. Blockchain kan inte existera isolerad, så integration med befintliga system krävs, utvecklingen av tjänster krävs, kompetenser krävs. 2016 var dedikerad till pilotning, 2017 bör passera under integrationen av blockchain-tekniken i den befintliga IT-infrastrukturen av organisationer.

Enligt studien av IBM-institutet för affärsvärde planerar mer än 50% av de finansiella sektorns respondenter att gå till fasen av den kommersiella användningen av teknik 2018-2020.

Blockchain, så långt du kan förstå, ger stora möjligheter till många affärsområden. Och vad säger du om utbyte av värdepappershandel? Kan denna teknik komma till nytta där?

Vladimir Alekseev

Företagskonsult för IBM Industrial Solutions i Ryssland och CIS

Det är värt att erkänna att utbytena var bland de första organisationerna som var intresserade av teknik och deltog aktivt i sin utveckling. Till exempel är den tyska utbytet (Deutsche Boerse) den hyperledger-blockerade projektets premiärminister, tillsammans med IBM, och Moskvas utbyte är också en del av deltagarna. Från den praktiska erfarenheten av att använda teknik med börser, noterar jag följande: Förra året genomförde den japanska börsen med IBM en studie av möjligheterna att använda distribuerade registren i sin verksamhet. I sin rapport betonade utbytet främjandet av teknik och noterade bland de viktigaste fördelarna med möjligheten att skapa nya innovativa finansiella tjänster och kostnadsreduktion. Enligt specialisterna på den japanska börsen kommer blockchain att hjälpa till att automatisera processerna för samordning av handelsförfarandena och öka systemets felstolerans som helhet på grund av införandet av principen om distribution.


Snälla berätta vad som planerar att hantera IBM de närmaste 5-10 åren? Vilket företag ser framtiden i framtiden?

Vladimir Alekseev

Företagskonsult för IBM Industrial Solutions i Ryssland och CIS

I början av detta år presenterade IBM hans blick om hur tekniska innovationer kommer att förändra världen i framtiden. Rapporten genomfördes av IBM Research Research Unit och återspeglar företagets uppfattning om hur världen kommer att förändras om fem år i fem riktningar. För det första är företaget uppmärksam på hur vi alla säger och skriver, och anser att dessa faktorer kommer att användas som indikatorer på psykologisk stat och fysisk hälsa. Nästa - Människor kommer att kunna hitta "övergripande" tack vare de små och kraftfulla kamrarna, vilket kommer att ge möjlighet att utforska nästan 100% av det elektromagnetiska spektrumet mot mindre än 1% för närvarande. Tekniken kan byggas i mobila enheter och hjälpa till att analysera sammansättningen av produkter eller droger. Å andra sidan, om fem år, kommer vi att kunna förstå jordens komplexitet med den fantastiska noggrannheten i detaljerna. Detta kommer att vara möjligt på grund av utvecklingen av Internet av saker (IoT) och maskininlärningsalgoritmer, på grundval av vilka slutsatser kan dras av analysen av de parametrar som tagits. IBM-forskare kallar det tillsammans "makroskop". Det kommer att bidra till att förutsäga sådana fenomen som klimatförändringar, vattennivå, kontamineringshot eller effekten av externa faktorer på vår planet.

Nästa riktning av utvecklingen av IBM-tekniken ser skapandet av medicinska laboratorier "på marker" för att spåra sjukdomar på nano-nivå, vilket kommer att bidra till att förutsäga sjukdomar i tidigare steg. I IBM-laboratorier arbetar experter med skapandet av 20 nm chips, som kan anslutas både till system för artificiell intelligens och till andra realtidssensorer. Och slutligen är det femte området skapandet och distributionen av "smarta" sensorer för en tidigare bestämning av nivån på miljöföroreningar. Sådana sensorer kan också vara extremt användbara för gasledningar, såväl som nära naturliga utsläppskällor, till exempel metan för att meddela ökningen av koncentrationerna av olika ämnen.

Det är värt att notera att i alla tekniska riktningar är i utveckling nu, så prognosen ser inte för futuristisk ut. Å andra sidan är tid och ansträngning nödvändig för att förfina befintliga produkter och ta dem till massanvändning.

Ur det långsiktiga perspektivets synvinkel (10 eller fler år) är det möjligt att ge ett exempel på kvantdatorsteknik. I algoritmen för kvantdatorer har absolut andra principer lagts, snarare än de som moderna datorer arbetar. Därför kan deras användning helt ändra befintliga processer, till exempel kryptografi och ge en helt ny nivå av datorkraft. IBM är en av ledarna på detta område, som redan ger gratis provtillgång till den verkliga kvantdatorn via IBM-kvantupplevelsen Cloud-infrastrukturen.

Ställ frågan till IBM-expert Elena Sinka, representant för försäljning av IBM-lösningar Fråga

Tack!
Din fråga skickas

3 september 2015 kl. 11:34

IBM Watson Kognitivt system: Principer för arbete med naturligt språk

  • IBM-blogg,
  • Algoritmer

IBM Watson är ett av de första kognitiva systemen i världen. Detta system kan mycket, tack vare vilka Watson-funktioner som används på många områden - från matlagning till förutsägelse av olyckor i bosättningar. I allmänhet är de flesta möjligheterna för Watson inte unika, men i komplexet är alla dessa funktioner ett mycket kraftfullt verktyg för att lösa en mängd olika problem.

Till exempel - erkännande av ett naturligt språk, dynamisk systemutbildning, konstruktion och bedömning av hypoteser. Allt detta gjorde det möjligt för IBM Watson att lära sig att ge direkta korrekta svar (med hög grad av tillförlitlighet) till operatörens frågor. Samtidigt kan det kognitiva systemet använda stora arrays av globala ostrukturerade data, stora data. Vilka är de grundläggande principerna för IBM Watson med språk? Om detta - i fortsättningen.

De viktigaste svårigheterna att erkänna naturligt språk

För en person är språket ett sätt att uttrycka tanke. Vi använder språket för att överföra sina åsikter, eventuella data och information. Vi kan göra prognoser och forma teorier. Det är språket - hörnstenen i vårt medvetande. Samtidigt är här ett paradox, det mänskliga språket är mycket felaktigt.

Många termer är ologiska, och datorsystem förstår oss väldigt svårt. Hur kan en tunn röst vara? Hur kan jag brinna från skam? För bilen är det ett problem, för en person, detsamma är en ganska vanlig sak. Faktum är att för det rätta svaret på frågan i många fall är det nödvändigt att ta hänsyn till det befintliga sammanhanget. I avsaknad av tillräcklig faktisk information är det svårt att korrekt svara på frågan, även om du kan hitta ett korrekt svar på elementen i frågan i den bokstavliga meningen.

Bearbetning av det naturliga språket - början

Många datorsystem kan analysera språket, men samtidigt utförs en ytanalys. Det kan till exempel vara meningsfullt för att kunna leverera en statistiskt motiverad bedömning av trender i förändrade känslor på stora informationsuppsättningar. Här är noggrannheten av informationsöverföringen inte för viktig, eftersom även om vi antar att antalet felaktiga positiva resultat är ungefär lika med antalet felaktiga negativa resultat, kompenserar de varandra.

Men om alla fall är viktiga, kan system som arbetar med ytanalys av språket inte längre göra sitt arbete normalt. Ett ljust exempel på vad som sägs vara en uppgift för en röstassistent av någon av de mobila enheterna. Om du säger "hitta mig en pizza", kommer assistenten att leda en lista över pizzerior. Om du säger "Leta inte efter mig en pizza i Madrid", till exempel, kommer systemet fortfarande att leta efter. Sådana system arbetar, identifierar några nyckelord och använder en specifik uppsättning regler. Resultatet kan vara korrekt i ett givet regelsystem, men felaktigt.

Djup bearbetning av naturligt språk

För att undervisa systemet att analysera komplexa semantiska strukturer, med hänsyn till känslor och andra faktorer, använde specialister djupt bearbetning av det naturliga språket. Nämligen frågan och svarssystemet (djup fråga * svarar, deepqa). Om hög noggrannhet krävs måste du använda ytterligare metoder för att bearbeta det naturliga språket.
IBM Watson - ett system med djup bearbetning av ett naturligt språk. När man analyserar en viss fråga, för att ge rätt svar, försöker systemet utvärdera som ett omfattande sammanhang som möjligt. I det här fallet används inte bara frågeinformationen, men också kunskapsbasdata.
Att skapa ett system som kan bära djupt bearbetning av ett naturligt språk gjorde det möjligt att lösa ett annat problem - en analys av en stor mängd information som genereras dagligen. Det här är ostrukturerad information, till exempel tweets, sociala nätverk, rapporter, artiklar och så vidare. IBM Watson lärde sig att använda allt detta för att lösa de uppgifter som en persons uppgifter.

IBM Watson kognitivt system

Watson är en annan nivå av beräkningsfunktioner. Systemet kan dela vissa uttalanden på det naturliga språket och hitta länkar mellan dessa uttalanden. Samtidigt klarar Watson med uppgiften, i många fall, ännu bättre än en person, medan behandling av data går mycket snabbare, arbetet utförs med mycket stora volymer - en person är helt enkelt oförmögen.

Huvudegenskaperna hos det kognitiva systemet

Systemet fungerar i den här ordningen:

1. Efter att ha fått en fråga utför Watson sin syntaktiska analys för att markera de viktigaste funktionerna i frågan.

2. Systemet genererar en serie hypoteser genom att surfa på huset på jakt efter fraser, vilket med viss sannolikhet kan innehålla det nödvändiga svaret. För att kunna genomföra en effektiv sökning i strömmar av ostrukturerad information behövs helt olika beräkningsfunktioner * de kallas kognitiva system. (Jag förstår inte riktigt den sista meningen och stjärnornas roll)

3. Systemet utför en djup jämförelse av språket för frågan och språket för var och en av de möjliga svaralternativen genom att tillämpa olika logiska utgångsalgoritmer.

Detta är ett svårt stadium. Det finns hundratals logiska utgångsalgoritmer, och de utför alla olika jämförelser. Till exempel, vissa söker efter sammanfallande termer och synonymer, den andra överväger tillfälliga och rumsliga egenskaper, medan den tredje analyserar lämpliga källor till kontextuell information.

4. Varje logisk utgångsalgoritm sätter ett eller flera uppskattningar som visar i vilken utsträckning det eventuella svaret följer av frågan i det område som anses av denna algoritm.

5. Varje erhållna betyg tilldelas sedan viktkoefficienten på en statistisk modell, som fixar hur framgångsrikt algoritmen har klarat av detektering av logiska länkar mellan två liknande fraser från detta område i "Learning Period" Watson. Denna statistiska modell kan därefter användas för att bestämma den totala konfidensnivån för Watson-systemet i det faktum att det möjliga svaret är en av frågan.

6. Watson upprepar processen för varje möjligt svaralternativ tills det hittar svaren som kommer att få fler chanser att vara korrekta än resten.

Som nämnts ovan är det nödvändigt att hänvisa till ytterligare datakällor till frågan. Det kan vara läroböcker, manualer, vanliga frågor, nyheter och allt annat. Watson om några sekunder hanterar stora arrays av information för att få rätt svar. I det här fallet är det funna innehållet också kontrollerat, föråldrade och värdelösa data.

Element i det kognitiva systemet

Den allmänna betydelsen av Watson-texten visar från den mottagna informationen från den extra basen. Detta använder dokumentrubriken, en del av dokumenttexten eller hela texten.

Kognitiva system, deras sätt att samla, memorera och extrahera information som liknar hur informationen analyserar informationen. I det här fallet kan kognitiva system överföra information och akt. Här är exempel på beteendekonstruktioner som används i det här fallet:

Förmågan att skapa och kontrollera hypoteser;
- Förmågan att dela upp i komponenterna och bygga logiska slutsatser om språket;
- Förmåga att extrahera och utvärdera användbar information (t.ex. datum, platser och egenskaper).

Utan dessa förmågor kommer varken datorn eller en person att kunna bestämma rätt förhållande mellan problem och svar.
Kognitiva processer med högre order kan uppnå en hög nivå av förståelse, med fokus på de viktigaste sätten att bete sig. För att förstå något måste vi kunna dela informationen i mindre element som är ganska välskötta på den aktuella nivån. Fysiska processer hos människor uppträder alls som processer i en rymdskala eller på nivå av elementära partiklar. De kognitiva systemen är också utformade för att fungera på mänsklig nivå, även om de representerar ett stort antal människor.

I detta avseende börjar förståelsen av språket med en förståelse för språkens enklaste regler - inte bara formell grammatik utan också informella avtal som följs i daglig användning.

Varför allt detta?

Nu kan det kognitiva systemet för IBM Watson, tack vare många år av lärande och förbättring, utföra arbete i olika sfärer. Här och medicin, matlagning och lingvistik och löser affärsuppgifter med vetenskapliga uppgifter.

Inledningsvis hade specialister ett val - att göra ett system universellt eller specialiserat. Varje alternativ har sina fördelar och nackdelar, men valet gjordes mot mångsidighet.

Företaget har redan varit övertygat många gånger i det perfekta valets korrekthet - före

Moderna superdatorer är flera serverdatorer förenade i nätverket. Hastigheten för deras beräkningar mäts i Petaflops.

  • 1 Petaflops \u003d 10 15 Operationer per sekund

Den genomsnittliga prestandan hos den mänskliga hjärnan är 20 Petaflops. Bara några superdatorer i världen har större prestanda, men ingen av dem kan ersätta den mänskliga hjärnan.

För närvarande finns det flera hundra superdatorer i världen. Den mest kraftfulla kommer att falla i den årliga rating på topp 500. År 2016 ledde denna rating av kinesisk Sunway Taihulight. Fram till det höll den kinesiska datorn Tianhe-2 också ledarskapet. IBM har två superdatorer i detta betyg: Mira och Sequoia. Den sista år 2012 var ledaren, och led nu fjärde.

Andrei Filatov (VD för IBM i Ryssland och CIS-länder) om kognitiv teknik

Dr. Watson - den mest kända superdatorn

Den största fördelen med Watson är att han förstår frågor på ett naturligt språk och svarar på dem, analyserar data. Under 2011 vann Watson människor i TV: n Jeopardy! (Ryska analog - "eget spel").

Watson är en uppsättning applikationsteknologier som heter "Cloud Services". Den mest aktiva Watson används i medicin, vilket bidrar till att diagnostisera och behandla cancer. Dess minne innehåller mer än 600 000 medicinska slutsatser. Det används också i den finansiella sfären, rättspraxis, hotellbranschen och många andra industrier. Dessutom är det även kapabelt att stödja en konversation med kändisar.

Ett fel inträffade under nedladdningen.

Watson kommunicerar med amerikansk tennisspelare Serena Williams

IBM Watson ansökningsområden

Utbildning.De amerikanska skolorna testas av lärarrådgivaren med Watson - ett kognitivt verktyg som erbjuder råd om förbättring av läroplaner och personalisering av utbildningsprogram.

Vetenskapen. Johnson & Johnson använder Watson för att analysera vetenskaplig litteratur. Från den enorma mängden material väljer det nödvändigt för studien, och studien kan genomföras mycket snabbare och effektivare.

Säkerhet.North Star BlueScope Steel Rolling Steel Tillverkare håller på att använda Watson Internet av saker för att skapa lösningar för att skydda arbetstagare i extrema situationer. Även arbetstagare kommer att bära enheter för att samla och bearbeta data. Om du upplever farliga förhållanden skickas villkoren omedelbart till den nordstjärniga manualen.

Cyberskydd. Cybercriminals väcker informationssystem för företag, och sedan sälja tillgång till dem i det "svarta" internetet. Om i en del av världen, ett misslyckande eller bedrägeri inträffade, kommer Watsonsystemet att förhindra andra användare av detta system.

Medicin. North Carolina University och 12 fler centra för att studera onkologiska sjukdomar använder Watson för att analysera patienter DNA för att sedan producera personliga behandlingstekniker.

Ingen läkare kan analysera ett så stort informationsprov, endast dator

En dator kan mycket åtminstone med avseende på informationsbehandling. Men för att lära det ett naturligt språk - en extremt nontrivial uppgift. Denna utmaning är baserad på IBM Deepqa-projektet, vilket en följd av vilken en kognitiv teknik föddes, kallad IBM Watson, till ära av Thomas Watson, som var på ursprunget till IBM-utbildning.

Förklara vad Watson är lätt är ett kognitivt system som kan kommunicera med en person på ett naturligt språk. Det är, förstå skriftligt tal och svara på samma sätt. Och om IBM var begränsat till detta, skulle Watson inte vara mer än experimentell installation. Men för honom hittade han snabbt arbete, och för många företag blev han en riktigt oumbärlig anställd.

Det visade sig att det är möjligt att tillämpa denna know-how vars de stora volymerna av ostrukturerade data krävs. För högkvalitativa och snabb analys av sådana data måste de bearbetas med hjälp av hela den tillgängliga verktyget för modern datorteknik: maskininlärning, dator lingvistik, ontologisk konstruktion och högpresterande databehandling. Det är för detta att IBM Watson är utformat.

IBM Watson Key Färdigheter kan minskas i fyra objekt:

  • Förstå ett naturligt språk.
  • Bygga hypoteser baserade på bearbetade data.
  • Utbildning i arbetsprocessen.
  • Inlämning av rekommendationer som åtföljer sina fakta som slutsatsen är baserad.

En person kan inte analysera en verkligt stor mängd data för en acceptabel tid, och i alla fall måste han förklara det mesta av informationen, fördela, enligt hans mening, det viktigaste. Det finns oundvikliga fel, dessutom är de kasserade data också medverkan och bör påverka resultatet. Och i denna aspekt överträffar Watson en person: det tar hänsyn till allt, inget känt kommer att förbli utan utvärdering.

Det första offentliga testet av systemet var att delta i det amerikanska spelet Jeopardy! (Ryska analog - "eget spel"). Utan att ansluta till Internet, med hjälp av öppna informationskällor, till exempel texten i alla Wikipedia, General Encyclopedia och Ordböcker, kunde Watson besegra två rekordinnare i det här spelet.

Vi inbjuder dig till IBM Client Center för seminariet "Watson Analytics" och avancerad teknik inom analytikområdet!







2021. gtavrl.ru..