På semantiken för bilder och prydnad av ryskt folkbroderi. Maslova G


Övning 1. Bestäm vad principen är.

Uppgift 2. Vilken grupp skulle du placera vart och ett av följande ord:
naken, levande, kolumn, död, ö, blind, sfär, vaktpost?

Uppgift 3. Till vilken grupp skulle du referera ordet månad?


Tips 1

Försök att lägga till någon gemensam del till dessa ord till vänster.

Lösning

Bilderna i tabellen visar schematiskt olika förhållande mellan "delen och helheten". Bilden är tydligast i första raden, där den är målad exakt halv cirkel. Om vi ​​kopplar detta övervägande med det faktum att den första raden bara innehåller ordet cirkel, du kan gissa att vi pratar om olika värden hos formanten kön (y) -... Verkligen, halvcirkel och Halv kilo- det här är exakt en halv cirkel respektive ett halvt kilo. Men det är inte alltid så enkelt.

Middag och midnatt- inte en halv dag och en halv natt (dessa värden uttrycks i ord middag jag är och full O chi), a mitten dag respektive natt (jämför engelska ord middag och midnatt). På bilden visas detta värde som cirkelns mittpunkt. Halvläskunnig vanligtvis kallar de inte de som har lärt sig exakt hälften av alfabetet, utan de analfabeter, de som nästan är analfabeter; halvklädd- de som nästan inte klädd. På motsvarande bild är bara en fjärdedel av cirkeln fylld. Till sist, halvt bortglömd - detta är inte halvt bortglömt, men nästan helt bortglömd; halvmörker händer inte i ett rum där bara hälften av lamporna är tända, men där man knappt kan se någonting. På bilden är därför tre fjärdedelar av cirkeln målad över.

Övning 1. Matchande bilder och värderingar kön (y)-:

Låt oss nu försöka gruppera orden från uppgift 2.

Låt oss först titta på substantiv. Enklast med ordet hemisfär- det här är egentligen exakt hälften av sfären:. Halvkolumn - det är en halvcirkelformad pelare som sticker ut från väggens plan med hälften av dess diameter:. MED halvö lite svårare. Det är klart att hälften av någon ö inte heter så. I den mån som Ö - en del av landet, omgiven på alla sidor av vatten, och halvö tvättas av vatten från tre av de fyra sidorna, är det mest logiskt att anta att här semi- betyder "nästan": (även om det fortfarande inte är riktigt fallet med orden halvt bortglömd eller halvmörker; se efterordet för lite mer information).

Låt oss nu ta itu med adjektiv. Som du kan se, i kombination med dem semi- betyder "nästan" och "nästan inte". Halvnaken - det är en synonym till ordet halvklädd, det vill säga den som är nästan naken, som har på sig betydligt mindre än nödvändigt:. Halvdöd - den som knappt lever är nästan död:. Halvdöd - synonym till halvlevande: . Halvblind - den som ser nästan ingenting, nästan blind:. Det finns ett ord kvar varje timme. Observera att adjektivet halvtimme har två betydelser. Det första betyder "en halvtimme långt": ett halvtimmes seminarium är hälften av en timmes längd. Men det finns en annan, mycket sällsyntare och mer speciell betydelse: ’sådant som inträffar mitt i timmen’. Så, till exempel, på vissa radiostationer ringer de ett nyhetsprogram som kommer ut 0:30, 1:30, 2:30, etc. Det visar sig att ordet halvtimme beroende på värdet kan hänföras till två grupper: och.

Låt oss sammanfatta svaren i en tabell.

Uppgift 2.

Uppgift 3.

Ord halvmåne intressant eftersom det är synonymt med ordet månad... Det visar sig att i detta ord semi- som om det inte betydde något. På bilden skulle detta kunna betecknas som. Sådana incidenter i språket inträffar ibland: du kan komma ihåg par av synonymer allvarlig och utom sig, värdefulla och ovärderlig eller ukrainska Hej och Hallå som båda står för 'låt'.

Efterord

När man studerar semantiken i ett naturligt språk upptäcker man ofta med beundran hur komplexa betydelserna av språkliga enheter är, som verkar vara ganska tydliga och transparenta. Till sådana enheter hör också ordbildningsformanten. sex-.

På modern ryska, ord på semi-är ganska vanliga. Endast i ordböcker finns det flera hundra av dem (i Small Academic Dictionary of the Russian language finns cirka tvåhundra), men i verkliga texter finns det mycket fler av dem: även i en liten korpus fanns det 1 500 olika ord i semi-... Nästan hälften av dem är adjektiv, cirka 40% är substantiv, 7% är verb (till exempel, luta tillbaka, halv kram) och 5 % - adverb (till exempel, hälften ifrågasättande, hälften på allvar). Listan över dessa ord delas in i tre olika grupper.

Först kan vi säga ( handla om) halv hink,(inte mer) sex månader och så vidare Sådana ord är av intresse för grammatiken (det är inte helt klart hur deras nominativa kasus ser ut och om det överhuvudtaget finns det), men ur betydelsesynpunkt finns det inget speciellt i dem: semi- här betyder "hälften".

Vanligare är "parad" semi-... Till exempel: Ett halvt sorgset, halvt hånande uttryck blixtrade över hans ansikte(I. S. Turgenev). Låt oss också komma ihåg Pushkins epigram: Hälften min herre, hälften köpman, / Hälften klok, hälften okunnig, / Hälften skurk, men det finns hopp / Det kommer att bli komplett äntligen. Sådan semi- har en betydelse som liknar den för parade konjunktioner antingen ... eller, inte det ... inte det: I slavisk hednisk folklore fanns det en sådan kategori av mytologiska varelser: dubbelsinnade. Hälften människa, hälften människa. Semi- "normal" - semi- "annan"("Ny värld"). Det kan kopplas till alla ord och till och med fraser.

Men det mest intressanta är den isolerade, oparade användningen av ord i semi-; de är vanligast. Det visar sig att semi- har flera mycket olika och till och med ibland motsatta betydelser.

Märkligt nog är den triviala betydelsen "hälften av något" för semi- väldigt atypiskt. Det finns vanligtvis i termer - namnen på figurerna ( halvcirkel, halvcirkel, halvcirkel), måttenheter ( half-acr, half-arshin), valutaenheter: halvt spole, halvt kejserligt, halvt penna etc. I de flesta fall är situationen mer komplicerad och intressant.

Tänk på skämtet om två entreprenörer: en optimist (som gläds åt att hans teater är halvfull) och en pessimist (som beklagar att hans teater är halvtom). Men betyder ordet halvtomt'Halvtomt'? Låt oss se några exempel: Konserthallar i provinsstäder är vanligtvis halvtomma, om inte en storstadskändis förväntas. Samma sak är det med provinsoperahus, där det nästan alltid är många fler människor på scenen än i aulan.(G. Vishnevskaya); I en halvtom lägenhet (Klavka och Rivka lyckades få ut allt!) stod det en stor herrdrink i köket(V. Kunin); Jag tog honom till ett litet, halvtomt rum med kala väggar, där fanns bara ett sjaskigt skrivbord utan nattduksbord, täckt med grönt, bläckfläckat papper och tre stolar(A. Rybakov). Det syns tydligt att adjektivet halvtomt i dessa exempel betyder inte "halvtomt", utan snarare "mycket mer tomt än fullt", "nästan tomt" (se figur 2). Detta är meningen med adjektivet halvtomt ordböcker urskiljs också.

Det visar sig att detta inte på något sätt är en olycka. Betyder "nästan" semi- uttrycker i ord som t.ex halvt galen, halvt vild, halvt bortglömd, halvt förfallen, halvt tiggare, halvt kollapsad, halvt berusad, halvt trasig och många andra. Men inte mindre ofta semi- har rakt motsatt betydelse!

Tänk, säg, ett par adjektiv halvnaken och halvklädd som möttes i problemet. Den första av dem betyder, som vi minns, "nästan naken": Då blixtrade omklädningsrummens planktak och stranden öppnade sig, på vilken hundratals halvnakna kroppar låg orörliga.(V. Pelevin). Det verkar som om enligt symmetrins lagar, adjektivet halvklädd borde ha betytt 'nästan klädd'. Detta är dock inte alls fallet. Det visar sig att halvklädd betyder alltid 'underklädd, knappt klädd'! ons: I nästan varje fönster, omväxlande med trefärgade flaggränder, stack halvklädda kvinnor ut, visade bara axlar, bröst, cyniskt ropade från fönster till fönster(M. Gorkij).

Det finns andra par av antonymer som i samband med semi- bildar synonymer: halvlevande och halvdöd(båda betyder "nästan döda") halvt laglig och halvkriminell('Nästan kriminell') halvt laglig och halvt underjordiskt('Nästan olagligt') halvkänd och halvt bortglömd('Nästan bortglömd') och så vidare. Du kan också ge ett exempel - halvmänniskor('Nästan inte människor') och halvdjur('Nästan odjur'): Och runt honom ett gäng av tunnhalsade ledare, Han leker med demimänniskors tjänster(O. Mandelstam) och Halvdjur, galna vildar(A. och B. Strugatsky).

Här är det som är särskilt intressant: synonymi i sådana fall uppnås inte på grund av det faktum att båda orden pekar på mitten av en viss skala, som i det skämtet om entreprenörer, utan på det faktum att semi- har i dessa fall två motsatta betydelser - "nästan" och "nästan inte". Det visar sig att båda orden på en sådan skala förskjuts till en pol (till exempel till polen "nakenhet" i fallet med halvnaken och halvklädd).

Det finns också "oparade" ord där semi- spelar roll "nästan inte": semi-utbildad, semi-bekant, semi-professionell etc. Här är ett levande exempel, där ordet halvläskunnig betyder "nästan analfabet": Eftersom han ville återuppliva vetenskapen, förenade denne halvläskunnige barbaren (till slutet av sina dagar, trots ständiga övningar, han aldrig lärde sig att skriva) de mest utbildade människorna på den tiden.(J. Heizinga). Om en person (även om det är Karl den Store) inte har lärt sig att skriva skulle det vara konstigt att tro att han har blivit halvläst.

Varför då semi- betyder "nästan" och "nästan inte"? Detta beror till stor del på bedömning, som ingår i det ursprungliga ordets betydelse. Ord som betyder negativ poäng, i kombination med semi- dras mot den första gruppen (som betyder "nästan"); ord, vars betydelse innehåller positiv poäng, i kombination med semi- dras mot den andra gruppen (vilket betyder "nästan inte"). Verkligen: försök att lägga till semi- till "negativa" ord galen, vanföreställning, tjuvar, vild, hånfull, död och till de "positiva" orden läskunnig, livlig, laglig, anständig, utbildad.

Ha semi- och fler värderingar. Till exempel: Några dumma alla, lydiga, halva stockar! Förutom Azovkin här, är det tydligen ingen som verkligen lider.(A. Solsjenitsyn). Ord halvstock här betyder inte 'en halv stock', 'nästan en stock' eller 'nästan en stock'. Snarare betyder det "som en stock", det vill säga semi- här har metaforisk fungera. Låt oss komma ihåg igen Hon är lysande, halvluftig, / Bågen för magin är lydig, / En skara nymfer är omgiven, / Istomin står(A.S. Pushkin). Detta värde är nära värdet för 'nästan', men ändå annorlunda: i det första fallet semi- oftare kombinerat med "graderade" ord (som beskriver mätbara värden), vilket indikerar en hög grad av funktionen, och i den andra - med "icke-graderad" (det är omöjligt att mäta graden av "luftighet" eller "loggliknande" ”).

Särskild betydelse semi- förekommer i termer som t.ex halvhård, halvmjuk, halvfet, halvbuske, halvledare, semipermeabel, halvöken... I dessa fall sex- pekar på mellanliggande position i klassificeringen eller genomsnittet värdet av någon funktion. Ordet fungerar på ungefär samma sätt halvö stött på i problemet. Här är ett annat konstigt exempel: Vid berömda timmar körde alla tre unga damer med m-lle Linon upp i en vagn till Tverskoy Boulevard i sina satinrockar - Dolly i en lång, Natalie i en halvlång och Kitty i en helt kort.(L. N. Tolstoj). Denna betydelse spelas anmärkningsvärt av Gogol i Dead Souls: De som inte tog, som tog, som vred sig i sina själar, som var halvt vridna och inte böjde sig alls - alla, inte utan spänning och oro, väntade på frigivningen av generalen... Och i inspelningarna av ryskt vardagstal (ovärderligt material för en lingvist!) kom följande exempel: Det finns en stol, ja, hon har några toaletttillbehör där, och hon är i en sådan midnattsskjorta... Här var det helt klart inte menat semi "nattklänning, a midnatt "jag skjorta(det vill säga ett klädesplagg som påminner en del om ett nattlinne, men lite annorlunda än det).

Förresten, i namnen på kläder och liknande föremål semi- har en till, mycket sällsynt betydelse "mer". kortän betecknat med det ursprungliga ordet ': låga skor, stövlar, kort kappa, halv regnkappa, halv mask, kort pälsrock (se fig. 3, 4).

Och slutligen, låt oss återigen minnas den fantastiska "tomma" som betyder det semi-, tydligen, har på ryska endast i ett fall - i ordet halvmåne synonymt med det ursprungliga ordet månad... Detta var naturligtvis inte alltid fallet. Tidigare kallades ordet månad även för fullmåne: Månen lyser, det klara lyser, fullmånen lyser. Men på modern ryska är månen vanligtvis rund, och månaden är skäreformad.

Värdena alltså semi- allt från "nästan inte NS"Till" exakt samma som X»:

'Inte X' → 'nästan inte X' ( halvläskunnig) → 'halv X-a' ( halvcirkel) → 'nästan X' ( halvvild) → 'X' ( halvmåne)

Litteratur:
1) A.V. Zelenin. Prefix golv- / semi-// Språket i den ryska emigrantpressen (1919-1939). Tammerfors, 200, sid. 200-202.
2) B.L. Iomdin. Semantik av det ryska prefixet SEMI- // Ryska studier på tröskeln till 2000-talet: problem och framtidsutsikter. Material från den internationella vetenskapliga konferensen (Moskva, 8-10 juni 2002)... Moskva, Irya RAN, 2003, sid. 109-113.
3) G.A.Kachevskaya. Till historien om sammansatta substantiv med GOLV- och SEMI- på ryska // Frågor om teori och språkhistoria. lö. Art., tillägnad minnet av B. A. Larin. L., 1969. S. 322–329.
4) I.A.Melchuk. Om siffran VÅNING 1// Ryska språket i modellen "Sense<=>Text". M.; Wien, 1995. S. 363–371.
5) O. Merkulova. Konfidentiella män med ett pre-positivt element kön (b) - / halva - i ukrainska mov XI-XVIII-talet // Bulletin of Lviv. un-tu. Serіya fіlol. 2004. Vip. 34. Del II. S. 84–92.

Problemet publicerades i artikeln:
B. L. Iomdin. Korpus av texter som en språklig Klondike. Utveckling av semantiska gruvor. Sammanfattning av seminarier // Språkvetenskap för alla. Sommarens språkskolor 2007-2008. M .: MTsNMO, 2009, sid. 142-157.

Detta kapitel ägnas åt en undersökning av estetisk kognitivisms möjligheter och utsikter inom ramen för den analytiska teorin om bilder. Denna disciplin är nära besläktad med analytisk estetik, och samtidigt delvis - om vissa författare (K. Walton, J. Hyman, R. Wallheim, etc.) helt kan rankas bland konstfilosoferna, då till andra (J. Kulwicki, F. Shier, etc.) en sådan egenskap är knappast tillämplig. De flesta teorier som utvecklats inom denna tradition är inriktade på problemet med att identifiera bilder som bilder och representationer - med andra ord på vad som är nödvändiga och tillräckliga förutsättningar och mekanismer för en elementär förståelse av bilder och, mer allmänt, hur bildrepresentation fungerar .

I bildernas analytiska filosofi finns det inga uttryckligen kognitiva eller antikognitiva teorier. Detta beror delvis på de ganska nära kontakterna med psykologi och kognitiv vetenskap, vars verktyg ofta används när frågor som ligger nära estetisk kognitivism uppstår (se: Hopkins, 2003; Lopes, 2003; Nanay, 2008; Rollins, 2009) . Samtidigt, inom ramen för denna tradition, är förståelsen av bilder som ett sätt att ”lagra, manipulera och överföra information” (Lopes, 1996, 7) alltför invanda för att särskilt uppmärksamma dess motivering. Samtidigt innehåller den en hel del teorier och intuitioner, med hjälp av vilka det är möjligt att bilda en ungefärlig skiss över ett kognitivt program. Ett sådant försök kan vara användbart för båda "sidor": det kan hjälpa till att avslöja några fruktbara implikationer i bildfilosofin, och för estetisk kognitivism kommer det att bli ett slags styrkeprov på grund av behovet av en noggrann och icke-reduktionistisk förståelse för bilder.

Den fortsatta presentationen kommer inte att göra anspråk på vare sig en storskalig teoretisk syntes eller utvecklingen av en oberoende komplett teori. Den kommer, i sin mest allmänna form, att beröra de strukturella och semantiska elementen i bilder och några av relationerna mellan dem. I detta arbete kommer vi att utgå från varianten av trippelstrukturen som föreslagits av D.M. Lopez (Ibid., 1-6) och inkluderar design, ämne och innehåll. Sättet att särskilja dem verkar vara fruktbart, men det skulle vara användbart att införa några modifikationer i deras tolkning.

Det första lagret inkluderar materiella och visuella medel, genom eller utifrån vilka bilder representerar sitt ämne och kan kännas igen som bilder: de kallas ofta för konfiguration (Dilworth, 2005, 259), och i de flesta allmänna termer sammanfaller de med den så kallade "formella". Till exempel, i förhållande till målning, är dessa "strökens struktur, storlek, form och riktning, självklarheten i användningen av ett visst medium eller en viss teknik, texturen på duken och till och med ytans planhet av målningen” (Newall, 2003, 381). Vi kommer att beteckna detta lager som en bildyta på grund av det faktum att en överföring av bilders egenskaper som ett begränsat plan utanför analysen av deras semantik skulle vara en både för enkel och för radikal lösning.

Det andra lagret - objektet - karaktäriserar bildernas funktion som beteckningar eller (ej helt specificerade) representationer av objekt, situationer eller händelser i den "yttre världen". Att förstå bilden på den minsta nödvändiga nivån innebär att känna igen dess objekt. Bortsett från bildytan och bildinnehållet kan detta lager reduceras till en referens – men med viss ansträngning och betydande förenklingar. En bild som en uppsättning av tre lager kan knappast reduceras till ett tecken, men nivån på ett objekt lämpar sig för en sådan reduktion, varför det kommer i förgrunden när man använder bilder i kommunikativa syften eller deras "bakgrunds" uppfattning i vardaglig praktik. Det omvända är också sant: till exempel i konstnärliga sammanhang kanske det inte är av största vikt. Dessutom krävs det inte för alla bilder utan undantag. Detta lager kan också kallas figurativt innehåll - i alla fall är det viktigt att det semantiska "innehållet" i bilder inte begränsas till det. Yta och objekt i olika versioner av deras beteckning är komponenter i det stora flertalet teorier om bildstruktur, och frågan om hur de interagerar med varandra har varit central i den analytiska filosofin kring bilder under en tid (se: Gombrich, 1951; Polanyi, 1970; Wollheim, 1980) ... Men det finns en version att urvalet av två lager uppenbarligen inte är tillräckligt och det är nödvändigt att ta hänsyn till det tredje, i vars roll i detta arbete är det bildmässiga innehållet. Lopez beskriver det som "de egenskaper som bilden tillskriver sitt objekt i representation" (Lopes, 1996, 3-4). Detta är en ganska tydlig och minimalistisk formulering, även om den återger en etablerad modell: till exempel när perception tolkas som representationer, definieras dess innehåll vanligtvis på samma sätt - som en uppsättning egenskaper som tillskrivs representationsobjektet ( nedan kommer vi att ge ett exempel på en liknande tolkning av perception av G. Evans). Men i förhållande till bilder av innehåll kan vi säga att det är det skikt som är svårast att begreppsliggöra och som vid den allra första approximationen lätt kan förväxlas med de andra två. Dess skillnader från ämnet är dock väsentliga: det bildmässiga innehållet kan inte översättas till ett uttalande eller uttömmande beskrivas med hjälp av språk. Det är inte heller identiskt med den bildmässiga ytan, eftersom bilderna inte karaktäriserar något objekt som, säg, bestående av fyrtiotre flerfärgade streck. Av detta följer att bildinnehållet är en strukturell komponent i bilden, som fyller en semantisk funktion och dessutom inte reduceras till vare sig objektet eller bildytan.

Vår preliminära hypotes är att det är vettigt att diskutera en betydande del av frågorna relaterade till bilders kognitiva och estetiska funktioner, såväl som till de senares specificitet, baserat på nivån på visuellt innehåll. Till att börja med överväga några teorier som, mer eller mindre framgångsrikt, tar upp frågan om bildinnehåll. Begreppet bildinnehåll är ett av de centrala och samtidigt de mest tvetydiga begreppen i aspekt-igenkänningsteorin av Dominic M. Lopez. Minns, det definieras av Lopez som de visuella egenskaper som bilden ger sitt objekt i representation: "När vi uppfattar bilden på rätt sätt får vi en upplevelse som representerar världen som att den har de egenskaper som bilden representerar" (ibid. ., 4). Om vi ​​följer Lopez logik, baseras de flesta föreställningarna om representation som likheten mellan bilden och det avbildade på en blandning av ämne och innehåll, eftersom två olika bilder kan representera samma motiv, men förse det med olika, ibland motsägelsefulla egenskaper. Lopez tilldelar innehållet den primära rollen i processen för objektigenkänning: "... vi identifierar objektet<изображения>baserat på dess innehåll ”(ibid., 107). Men även under detta villkor är bildernas bildinnehåll asymmetriskt i förhållande till innehållet i upplevelsen av perception, eftersom de kan ge sitt objekt visuella egenskaper som inte kan ses i vardagens praktik (se: ibid., 124).

Lopez formulerar produktivt definitionen av bildinnehåll och tesen om dess asymmetri i förhållande till bildens ämne och mottagarens perceptuella upplevelse, men åtminstone två problem är förknippade med hans avslöjande av detta begrepp. För det första är huvuduppgiften för Lopez teori som helhet att bestämma hur den minsta nödvändiga förståelsen av bilder som bilder och objektet som representeras i dem sker, och i detta avseende utvecklar han en igenkänningsteori, som antar att förståelsen av bilder beror på helt på att arbeta med vanliga perceptuella färdigheter (se: Lopes, 2003). Grovt sett: om människor har förmågan att känna igen ansikten som har förändrats kraftigt under decennier, då vore det konstigt om denna förmåga ”stängdes av” i processen att uppfatta bilder. Vi har inga invändningar mot denna teori, men det bör noteras att bildinnehållet, som ett inslag i själva bilderna, i den snarare tilldelas en hjälproll som ett sätt att förklara igenkänningsmekanismen. För det andra använder Lopez detta koncept huvudsakligen i samband med teorin om Gareth Evans, författaren till det inflytelserika arbetet om referensteorin (Evans, 1982). Denna omständighet måste avslöjas mer i detalj.

G. Evans anses vara den första (åtminstone inom den analytiska traditionen) teoretikern av icke-konceptuellt mentalt innehåll: han hävdade att det mänskliga informationssystemet gör det på perceptionsnivå (proprioception, orientering i rymden, visuell perception, etc.) behöver inte använda begrepp - som en konsekvens är informationstillstånd relativt oberoende av övertygelser (se: ibid., 122-129). Uppfattningar utan begrepp är vanliga, men "bedömningar baserade på dessa tillstånd involverar nödvändigtvis begreppsbildning" (ibid., 227). En viktig del av Lopez teori (som de flesta teorier om visuellt innehåll) bygger just på denna tes, som utgår från att representationen av världen (oavsett hur "komplex" den skulle vara) kan utföras utan förmedling av språk, föreställningar och konceptuellt tänkande. I stort sett extrapolerar Lopez Evans resultat till problemet med bildinnehåll, som ur hans synvinkel "... också är icke-konceptuella. Naturligtvis, att kunna känna igen motivet för bilden i ett brett spektrum av aspekter, inklusive bildmässigt, innebär att ha sina koncept. Men tillämpningen av urskillningsförmåga attraherar känslighet för aspekter och egenskaper som vi inte behöver och vanligtvis inte besitter” (Lopes, 1996, 187). Är lösningen framgångsrik när det gäller att förklara bildinnehåll genom Evans teori?

Om vi ​​med bildinnehållet förstår helheten av alla egenskaper som tillskrivs objektet i representationen, så verkar detta beslut vara korrekt. Så ett av huvudargumenten till förmån för teorier om icke-konceptuellt innehåll var indikationen att människor har ett ganska begränsat antal begrepp till sitt förfogande, vilket inte täcker till exempel var och en av de upplevda färgnyanserna: perceptuella skillnader är många gånger fler och betydligt mer subtila än konceptuella (se: Evans, 1982, 229; Peacocke, 1992). Detsamma kan sägas om det bildmässiga innehållet: om du försöker namnge och lista alla egenskaper som manifesteras i det, kommer begreppen och medlen för verbalisering att uttömmas ganska snabbt - trots att de manifesterade egenskaperna fortfarande kommer att förstås och förstås. snabbt och adekvat. Visserligen, åtminstone i denna mening, är det bildmässiga innehållet icke-konceptuellt, men Lopez beslut att förlita sig på Evans (och inte någon av hans anhängare) är något problematiskt. Faktum är att Evans tolkade perception enligt representationsmodellen, som: a) följer vissa kriterier för korrekthet; b) det förstås enligt "input-output"-modellen, och egenskaperna för objekt vid ingången sparas vid utgången; c) är transparent - när vi tänker på det upplevda objektet tänker vi på det direkt, och inte på informationstillståndet eller dess icke-konceptuella innehåll (se: Evans, 1982, 122-129, 151-170). Här börjar analogin halta, eftersom, som vi ska försöka visa i det följande, det bildmässiga innehållet är medvetet ogenomskinligt och kan inte bevara och demonstrera alla egenskaper hos ett objekt "som det är".

Det bör noteras att Evans förhållningssätt till innehållet i perceptuell upplevelse skiljer sig från Lopezs teori om bilder i åtminstone en viktig aspekt. Evans förnekade att "... specifikationen av innehållet i ett fotografi kommer med nödvändighet att referera till dess objekt eller objekt" (ibid., 125). Med andra ord kan det icke-konceptuella innehållet i representationer inte bara tjäna som en representation eller visning av den upplevda världen, utan också vara relativt autonom. Om vi, efter Lopez exempel, extrapolerar denna omständighet till bildområdet, visar det sig att det i alla bilder är möjligt att urskilja en semantiskt viktig komponent som har en icke-konceptuell natur och samtidigt , är inte reducerbar till igenkänning - eller åtminstone inte uttömd av den senare funktionen.

På exemplet med Lopez teori kan man tydligt se ett problem som är gemensamt för många författare inom ramen för analytiska teorier om bilder: det kan betecknas som en reduktion av det strukturella till det perceptuella. I många fall är detta det enda möjliga draget, men när det gäller bildinnehåll hindras den redan begränsade teoretiska tillgången till det senare endast av användningen av en analogi på grundval av vilken övertygande allmänna teorier om bilder kan föras fram. , men det är extremt svårt att avgöra vad bildinnehållet är som en separat strukturell komponent. Dessutom bygger hans version av perceptualism på representativa teorier om medvetande och perception, vars produktivitet är ett separat problem (vi återkommer till det i nästa kapitel). Som ett resultat av detta visar sig Lopez inställning till denna fråga vara produktiv främst på nivån med de ursprungliga definitionerna. Frågan uppstår: kan dessa svårigheter undvikas genom teorier som är inriktade på bilders struktur?

En av teorierna av detta slag föreslogs av John Kulwicki, som kan kallas den mest konsekventa efterträdaren (tillsammans med K. Elgin och O. Scholz) och samtidigt en kritiker av N. Goodmans tillvägagångssätt. Följaktligen, för att förstå hans tolkning av det bildmässiga innehållet, är det nödvändigt att ta hänsyn till två attityder "ärvt" från Goodman: a) ett systematiskt tillvägagångssätt, fokuserat mer på representationssystem och relationer mellan deras element än på enskilda prover; b) en tydlig distinktion mellan bilders struktur och semantik, och när han förklarar Kulwickis bilder, efter Goodman, prioriterar han syntaktik. Därför skissar vi till att börja med flera viktiga begrepp i hans teori om bilders syntax – utan dem riskerar analysen av tolkningen av det bildinnehåll som ges till honom att "hänga i luften". Polemiskt utifrån Goodman identifierar Kulvicki flera syntaktiskt relevanta egenskaper hos bildsystem: relativ rikedom, relativ syntaktisk känslighet och semantisk rikedom (Kulvicki, 2006, 32-38). Liksom i fallet med liknande Goodman-kriterier förstår de nämnda egenskaperna inte särskilt detaljerna hos bilder - både individuellt och sammantaget kan de hittas i andra representationssystem (detta syftar främst på den semantiska rikedomen, tack vare vilken bildsystem kan kategoriseras som språk). Därför introducerar Kulwicki ett annat kriterium: transparens (se: ibid., 49-79). Före honom, i de analytiska teorierna om bilder, användes begreppet transparens vanligtvis för att analysera fotografiska bilder och reducerades i de flesta fall till att när fotografier uppfattas genomförs en indirekt vision av själva objekten; med andra ord, vi ser bokstavligen genom fotografier (se: Scruton, 1983; Walton, 1984). Kulwicki, å andra sidan, extrapolerar begreppet transparens till alla representationssystem och gör det både syntaktiskt och semantiskt. I denna tolkning förutsätter transparens att om en representation presenteras i en annan (som är fallet med många "målningar i en bild" eller fotografier-tillägnanden av Sherry Levine), så kommer de att vara identiska syntaktiskt och semantiskt - med andra ord, för mottagaren de kommer att vara "lika" visuellt och de kommer att känna igen samma sak. Vi kommer att prata om några av konsekvenserna av denna tolkning av transparens nedan.

Efter John Hoageland (1998, 171-206) skiljer Kulwicki mellan två typer, eller lager, av bildinnehåll - "skelett" (innehåll av blotta ben) och "innehåll som är fritt fram". (För enkelhetens skull, låt oss försöka översätta dem som råinnehåll respektive färdigt innehåll). Kulwicki förklarar deras specificitet på ett ganska riskabelt sätt i analogi med skillnaden mellan råa "sensoriska data" och medveten perceptuell kunskap, som kan tjäna som en grund för bedömning. För att uttrycka det enkelt ger råinnehållet en möjlighet att 'ta fram' det som är färdigt: det '... berättar för oss att vissa färger och ganska abstrakta rumsliga egenskaper, som någots koniska form, rakhet, och så vidare, finns i vissa relativa platser' (Kulvicki, 2006, 166). Rent tekniskt kan råinnehåll tolkas och fyllas på många olika sätt - i detta avseende är det inte bara schematiskt utan också kaotiskt. Emellertid sker vanligtvis processen att förstå bilder omedelbart på grund av att igenkänningsbegrepp "utlöses" som gör att vi kan isolera "perceptuellt framhävda" element från det råa innehållet: "vi gör det här inte för att det inte kan finnas några andra tolkningar, utan för att vi inte har begrepp redo involverar omedelbart andra, ovanliga fall av råinnehåll”(ibid., 174). Färdigt innehåll fungerar alltså som en reducering av oförutsägbart råinnehåll till ett antal "mer vanliga" (ibid., 146) färdiga begrepp. Kulwickis teori går förbi det bildmässiga innehållet som det används i detta arbete: det visar sig att det råa innehållet som helhet sammanfaller med den bildliga ytan, det färdiga innehållet - med objektet, och "privilegiet" av bildens semantiska mättnad är ges till tittaren. Dessutom är det inte särskilt väl lämpat för konstnärliga bilder, i vilket fall användningen av färdiga koncept inte alltid är den bästa lösningen. Kulwickis tolkning av transparens är dock en produktiv och viktig punkt att uppehålla sig vid ett tag.

Denna tolkning är intressant eftersom den betraktar transparens som en syntaktisk relation som är homolog med upplevelsen av perception: "... i denna strukturella typ av transparens kan intuitioner om perceptuell transparens i bilder spåras" (ibid., 50). Den "vanliga" idén om transparens, såväl som relaterade begrepp som "realism", driver dem att utföra dem enligt avdelningen för bilders semantik eller teorin om deras uppfattning, eftersom det intuitivt kan tyckas att verklighetens effekt är resultatet av ett något ordnat förhållande mellan bilden och "verkligheten". Men om tolkningen av transparens som en syntaktisk relation är korrekt, skickas en väsentlig del av de egenskaper hos bilder som bidrar till deras "tillförlitlighet" eller mimeticitet till området för relationer mellan bilder. Som en konsekvens är dessa frågor knappast relevanta i förhållande till det bildinnehåll och de relationer som kan urskiljas inom en enskild bild.

Författarna ovan berör inte på något sätt frågan om det visuella innehållets estetiska potential. John Dilworths teori om konstens "dubbla innehåll" (Dilworth, 2005a; Dilworth, 2007) är i sin tur inte särskilt väl lämpad för icke-konstnärliga bilder: författaren positionerar den som en teori om konst i allmänhet (och dessutom, med vissa modifieringar, även som en teoriuppfattning (se: Dilworth, 2005b)). Dilworths uppgift är att utveckla en övertygande förklaringsmodell för estetik som inte går utöver teorin om representation och inte reducerar konsten till en "enkel" betydelse. Dilworth gör följande: han reducerar analysen av konst enbart till analys av innehåll, men delar upp den senare i två typer. Från hans synvinkel, tillsammans med den representativa (eller tematiska) kan man i konstnärliga bilder observera det faktiska konstnärliga innehållet (han kallar det också stilistiskt eller aspektuellt), vilket inkluderar ett ganska brett spektrum av faktorer - stilistiska, uttrycksfulla, avsiktliga , etc. De motsvarar två komponenter i bildstrukturen i Dilworths version: "the expressed structure of the work" och "encrypted content" (Dilworth, 2005a). Följaktligen kan konstnärlig specificitet förklaras genom att hänvisa till konstnärligt innehåll, men Dilworth specificerar det senare som strukturellt likt innehållet i perceptuell erfarenhet - detta är ett steg som vi redan har observerat i Lopez: "... det verkar klart att det mesta av det konstnärliga innehållet bör vara ett slags icke-konceptuellt innehåll” (Dilworth, 2007, 22). På grund av denna assimilering tilldelas stilistiskt innehåll en "kognitiv prioritet" som en konsekvens av förmågan att göra de mest subtila distinktionerna och "kryptera" information i större kvantiteter än något tematiskt innehåll kan inkludera (Dilworth, 2005a, 252). I allmänna termer presenteras denna teori som en erfarenhet av att översätta formalistiska konstteorier till representationsteoriernas språk, men det bör noteras att separationen och autonomiseringen av de två typerna av innehåll resulterar i deras relativa oberoende i förhållande till varje annat: samma sak kan sägas om relationerna ämne och visuellt innehåll.

Dilworth upprepar till stor del det tillvägagångssätt som används i några av Richard Wollheims senare verk (Wollheim, 2001), och skiljer representativt innehåll (det som kan ses på bilden) och figurativt innehåll (det som kan ses och sammanfattas under icke-abstrakta begrepp som t.ex. "bord", "Hatt" eller "Vladimir Putin"). Båda typerna av innehåll är inbäddade i "form", uppfattat som en målad yta, och om figurativt innehåll helt beror på konceptualisering och inte kan återfinnas i alla bilder, så kan detta inte sägas om representativt innehåll. Med ytterst sällsynta undantag finns det också i abstrakt måleri, eftersom det i första hand bygger på allokeringen av rumsliga relationer inom ramen för den bildliga ytan: "<абстрактные изображения>kräva av oss att vi, förutom att vara uppmärksamma på den markerade ytan, ser något i den, något bakom eller framför den, något annat” (Wollheim, 2001, 131).

Det verkar som om Wallheims teori är den enda av de som övervägts ovan, fokuserad på bildernas "icke-tematiska" och "icke-figurativa" semantik, som i allmänhet skulle sammanfalla med versionen av den trippelstruktur som föreslagits av Lopez och, vid samtidigt, skulle lyfta fram ett kriterium för att beteckna vad vi betecknar efter bakom Lopez som bildinnehåll. Att etablera rumsliga relationer är något som inte kännetecknar varken en yta eller ett objekt, och det är detta som ger bilder med minimalt semantiskt innehåll.

Innan vi går vidare till ytterligare förtydliganden, låt oss återigen komma ihåg strukturen på bilden som beskrivs ovan. Så när vi tittar på någon bild kan vi känna igen dess objekt (återkalla, i vid mening) och namnge det eller sticka ett finger på det. Vi kan också fokusera på materialytan och ange på vilket plan (eller inte plan) och med vilka visuella medel bilden är gjord. Dessutom kan vi se exakt hur och hur det nämnda föremålet presenteras, det vill säga vilka synliga egenskaper det är försett med i bilden - och med viss lust och ansträngning kan vi beteckna några av dem (åtminstone ungefärligt och metaforiskt ) och därmed för att karakterisera en del av det bildmässiga innehållet. Alla tre lager är urskiljbara, men bara som ett resultat av en speciell ansträngning - utan det utgör de organiskt den observerade bilden. Det är ganska lätt att byta till ett objekt eller en yta: i det första fallet räcker det att titta på bilden i det vanliga bakgrundsläget, som på ett foto från en annons i en transport; i det andra fallet kan du behandla bilden som en artefakt med färg, streck etc. Det bildmässiga innehållet "mättar" i sin tur förståelsen av bilden, men kännetecknas av begränsad perceptuell tillgång, som inte ger efter för visuell separation från helheten utan något stöd på de andra två lagren. Är inte denna term bara en beteckning på förhållandet mellan ytan och föremålet som betraktaren tolkar? Hur oberoende är det bildmässiga innehållet? Kan man kalla det ett "lager" mellan andra nivåer i bilden? Enligt vår mening skulle det i detta skede vara nyttigt att inte koncentrera sig på bildinnehållet separat, utan på dess förhållande till ämnet och bildytan.

För att förstå detaljerna i förhållandet mellan det visuella innehållet och motivet är det värt att påpeka bildernas skattemässiga och selektiva karaktär. Analogitet är i första hand en syntaktisk egenskap hos bildsystem, men till skillnad från transparens har den viktiga implikationer för bildinnehåll. Nelson Goodman var den första som försökte karakterisera bildsystem som analoga i motsats till diskreta system - främst språk (se: Goodman, 1968, 159-164). Analoga system skiljer sig i både syntaktisk och semantisk densitet. På systemnivå betyder detta att ett språk till exempel består av en begränsad uppsättning tydligt differentierade element, medan det i förhållande till bildsystem inte kan sägas: både antalet element och metoderna för deras differentiering eller jämförelse är potentiellt oändliga , inte kodifierad och inte deterministisk. På nivån för system och individuella bilder är konsekvensen av bildernas analoga specificitet följande: varje - oavsett hur liten - förändring i deras yta kan leda till betydande förändringar i deras innehåll. I sin tur arbetar Fred Dretske (1982, 135-141) i sin klassificering med "input-output"-modellen: med diskret kodning av information är utgången densamma som ingången, och i fallet med analog kodning, utgången kommer att vara en annan mängd information - och, kanske, kommer det att vara helt annorlunda. I detta avseende kännetecknas bilderna av sin markant analoga specificitet. Samtidigt har Dretske ett viktigt förtydligande. Faktum är att analoga signaler alltid bär en viss mängd information i en diskret form, och i förhållande till bilder likställer Dretske inte helt korrekt denna information med tematiskt innehåll: ur hans synvinkel, till och med en återberättelse av "situationen om som bilden förmedlar information" skulle vara en outhärdligt lång och absurt detaljerad verbal beskrivning (Ibid., 138).

Analogitet är varken en tillräcklig eller exklusiv egenskap av bildinnehåll (se: Peacocke, 1989): den är snarare viktig som ett underordnat koncept och kommer att överskattas kraftigt om det betraktas utanför selektiviteten. Detta koncept går tillbaka till ett argument som Ned Block förde fram i diskussioner av sinnefilosofer och psykologer om mentala bilder. Block försvarade perceptualisternas ståndpunkt och påpekade det så kallade "fotografiska felet", som består i att tillskriva mentala representationer fullständig visuell beslutsamhet och fotografiska detaljer (Block, 1983). Ur hans synvinkel är visuella representationer alltid selektiva i den meningen att de involverar urval av ett visst antal representerade egenskaper till skada för andra. Flint Schiers och Dominic Lopez' erkännandeteorier är till stor del baserade på denna idé. Enligt Schier kan egenskaper eller objekt "utelämnas" av en bild vara godtyckligt betydelsefulla i vardaglig interaktion med dem, men detta kommer inte att påverka förståelsen av bilder, eftersom själva idén om selektivitet är en del av vår bakgrundskunskap om bilder: "När Poussin avbildar en figur som springer utanför ramarna, antar vi inte att han avbildar den halvskuren" (Schier, 1986, 163). Alla bilder är påtvingat selektiva, eftersom "... de inte ens kan antyda varje visuellt tillgänglig och potentiellt avbildad egenskap hos det valda objektet" (Ibid., 165), men den vanligaste typen av selektivitet är förknippad med det faktum att syn, i en eller annan grad isomorf för mottagarens perceptuella upplevelse (Lopes, 2003).

Av bildernas analoga natur följer det först och främst att de inte representerar något "bara sådär": begåvningen av det presenterade föremålet med vissa egenskaper är nästan oundvikligt, och i fallet med konstnärliga bilder, innovationen och icke-trivialiteten av bilder. denna begåvning eller tilldelning av föremålet till en ny kategori kan tjäna som kriterier för att bestämma konstnärligt värde (se: Goodman, 1976, 27-34). Men vinsten i information som uppnås på detta sätt, som inte är helt oförutsägbar och asymmetrisk med avseende på både objektet och korrelatet till det senare i den "synliga världen", visar sig vara begränsad av bildernas selektivitet, vilket, utför dock vanligtvis en organiserande funktion, eftersom bilderna inte bara är selektiva: valet gjordes i dem på ett visst sätt. Som ett resultat visar sig det bildmässiga innehållet vara obestämt i förhållande till dess ämne: det senare bestämmer inte vilka egenskaper som kommer att tillskrivas det. Av dessa utvecklingar kan en ganska uppenbar slutsats dras: bildernas semantiska funktion kan inte reduceras till beteckningen av något objekt. Bilder är inte så mycket representationer som tolkningar av vad de representerar, och i detta avseende är de relativt oberoende i förhållande till både "omvärlden" och till vardagsuppfattningen.

Här skulle det vara användbart att återigen påminna om Lopez definition, från vilken vi utgick från hela detta kapitel: när en bild tillskriver ett objekt vissa egenskaper, och detta är oundvikligt, får den sitt eget bildinnehåll. Dvs det senare tolkas genom relationen till subjektet. Enligt vår mening är detta inte riktigt tillräckligt: ​​åtminstone i vissa fall är förhållandet mellan det visuella innehållet och ytan mer betydande. Som visats ovan har Goodman och Wallheim redan noterat det första lagrets beroende av det andra - om åtminstone minimala förändringar görs på ytan kan det bildmässiga innehållet förändras avsevärt. Men detta beroende är inte helt säkert: till exempel, på grund av förtrogenhet med särdragen hos svartvita fotografier, uppfattas de inte representera sitt motiv som svartvita. Det speciella med hur dessa två lager samverkar är ett separat problem som förtjänar en mer detaljerad övervägande och som kan göra det möjligt för oss att föra bildernas analytiska filosofi till en bredare problematik av det figurativa. Det kan också antydas att bildernas estetiska funktion inte bara och inte så mycket kännetecknas av den motsvarande attityden hos perceivern. Här är de strukturella egenskaperna för "aktiveringen" av bilden i upplevelsen viktigare, när det bildmässiga innehållet och den bildliga ytan "sticker ut" framåt, och därigenom tydligt demonstrerar det bildligas särdrag och åtminstone delvis förskjuter objektet.

Begreppet bildinnehåll kan enligt vår mening, i den form som ovan grovt angetts ovan och med förbehåll för vidareutveckling, anses vara en lämplig utgångspunkt för att vidga analytiska ansatser för att förstå bilder. I synnerhet kommer detta att göra det möjligt att ta dem utanför ramarna för representativa och semiotiska teorier och förutsättningar, och även "smärtfritt" tillämpa dem, till exempel på abstrakt konst (vilket vanligtvis inte hävdas av författare som arbetar i denna tradition). Dessutom finns ett av alternativen för att integrera analytiska och fenomenologiska teorier om bilder här. Det är således svårt att inte lägga märke till den ofullständiga men betydande likheten mellan det bildmässiga innehållet och den "bildande kraften" i tolkningen av Paul Crowther: båda begreppen försöker förstå de interna generativa relationer och potentialer som utgör den "immanenta betydelsen av bild” (Crowther, 2009, 17) ... Dessutom korsar de ovan nämnda egenskaperna hos det bildmässiga innehållet (främst den tolkande karaktären och oberoendet av ämnet) med vad Crowther betecknar som relativ semantisk autonomi på den "logiska" nivån, korrelerande med modal plasticitet på den ontologiska nivån (Ibid. , 39) ... Men i det här fallet är det inte ”färdiga” begreppsmässiga tillfälligheter som är viktiga, utan snarare det faktum att det skulle vara användbart för den analytiska bildteorin att interagera med den fenomenologiska bildteorin, främst på grund av att sistnämnda har betydligt fler utvecklingar när det gäller den bildliga ytan.

Ovanstående presentation är ofullständig och ungefärlig, men det räcker för att besvara frågorna i detta kapitel: vad är bilders kognitiva funktion och vilka är utsikterna för estetisk kognitivism på detta område?

Intuitivt verkar förekomsten av kognitiv funktion i bilder uppenbar: en betydande del av vår perceptuella kunskap (Dretske, 1969) bygger uteslutande på dem, och de används också framgångsrikt inom vetenskapen som verktyg för att få kunskap (Kulvicki, 2010). Bilder låter dig förmedla en stor mängd korrekt kvalitativ och kvantitativ information - mer exakt, de förmedlar framgångsrikt denna information till mottagaren och gör den tillgänglig för ytterligare konceptualisering. Till exempel, inom vetenskapen används de oftast som samtidigt transparenta, korrekta och rika representationer: "vi kan tänka i bilder, snarare än att bara dechiffrera dem och tänka på deras innehåll - i den meningen att perceptuella slutsatser från deras detaljer leder oss direkt till slutsatser om deras innehåll ”(Ibid., 311). Denna omständighet är tillämplig på bilder inom vetenskapen, men påverkar knappast, säg, deras existens i konsten, där reduktionen av en bild till dess motiv oftare är ett symptom på "felaktig" hantering av den. Bilder är extremt flexibla i förhållande till hur de används (se: Novitz, 1977): som en konsekvens av detta kommer betoningen på förekomsten av deras användning som kommunikationsmedel inte att ge en uttömmande beskrivning.

Om vi ​​antar den kognitiva användningen av bilder i sin helhet, så är det kognitiva innehållet i visuell upplevelse och specificiteten hos den kunskap som erhållits inte förutbestämda och förutsägbara. De är dock inte obegränsade och bör inte överskattas - utanför specialiserade fall som vetenskap, förekommer perception och förståelse av bilder oftast "i bakgrunden" och är vanligtvis begränsad till tidsmässiga, yttre (distraktioner, miljö, etc.) och psykologiska (uppmärksamhet) förhållanden. Det är inte heller meningsfullt att överdriva det epistemologiska värdet av bilder som bevis – när det gäller deras egenskaper (selektivitet, analogi, etc.) ligger bilder närmare tolkning än bevis. Det kognitiva värdet av bilder i det "praktiska livet" är inte så mycket en konsekvens av bilders strukturella egenskaper som av specificiteten hos generering eller överföring av information och förhållanden som åtföljer processen att använda, uppfatta och förstå specifika bilder.

Som ett resultat av detta framstår perspektiven för estetisk kognitivism i bildforskningen som ganska oklara, eller åtminstone variera från en version av kognitivism till en annan. Den "starka" versionen ser uppenbarligen ganska förlorande ut i detta sammanhang, främst för att den blockerar tillgången till nivåerna av bildinnehåll och bildyta för sig själv: eftersom det bildmässiga innehållet i konstnärliga bilder inte är propositionellt, är kriterierna för sanning eller falskhet. knappast tillämplig på det. När det gäller ämnesinnehållet, när du försöker göra ett uttalande på grundval av det, faller slutresultatet omedelbart under argumentet om trivialitet. I sin tur kommer försök att isolera en del pedagogisk kunskap från det tematiska innehållet i visuella konstföremål också att vara irrelevanta: att reduceras till ett ämne blir en bild av en biblisk handling bara en mer eller mindre övertygande illustration av viss undervisning, innehållet varav är känt i förväg och dessutom vanligtvis ur sitt sammanhang (se: Bantinaki, 2008).

I sin tur har de "svaga" versionerna av kognitivism potentiellt fler chanser, men de kommer troligen att bestå antingen i att identifiera platsen för bildinnehållet i bildernas estetiska eller kognitiva funktion (det här alternativet är fortfarande svårt på grund av det otillräckligt utvecklade begreppsapparat, som skulle hjälpa till att närma sig detta problem), eller vilka är de kognitiva aspekterna eller konsekvenserna av uppfattningen av bilder. Utgångspunkten för det andra alternativet formulerades ganska tydligt av D. Lopez: ”För det första hävdar jag att vårt engagemang i de flesta konstverk – både som skapare och som konsumenter – beror på att träna samma kognitiva förmågor som de som vi använder för orientering i miljön och samspel med företrädare av vårt slag. För det andra hävdar jag att i vårt engagemang med konstverk är dessa kognitiva förmågor tänkta att expandera i nya riktningar, och agera på ett sätt som inte är någon annanstans utanför konstens sammanhang” (Lopes, 2003, 645-646). I denna version kan det kognitiva programmet inom bildforskning intressant kombineras med Goodmans kognitivism som presenterades i slutet av föregående kapitel.

estetik kognitiv konstuppfattning

Hörn: Annonser i ett rektangulärt horisontellt format. Bilden är fotograferad, kameran är en teknik, något oorganiskt, mekaniskt. Formen på servetterna är också rektangulär, vilket också indikerar deras konstgjorda produktion, förpackning, teknik.

Kurvor: men annonsen visar kurvor, rundade former - en man, en sko, en hamburgare, till och med servetter i en mjuk "pösig" förpackning, vilket indikerar naturlighet (beträffande sneakern, detta är förmodligen dess plast, anpassad till människokroppen, bekvämlighet), tillit, ekologiskt etc. Man kan också anta att munnen är formen av en triangel, den är som en kraftkoncentration, en riktning "inåt", som en indikator på rörelse "var".

Attityd

Horisontell vinkel

Frontal (ur frontal synvinkel)

Har en försvinnande punkt vid horisonten (perspektiv). I det här fallet avbildas en del av vår "integrerade" värld som vi lever i. Vi befinner oss inte i korsningen av perspektivpunkter och olika versioner av verkligheten, eftersom den visas i bilder som "sned synvinkel". I bilden med en försvinnande punkt vid horisonten visas en enda verklighet med den avbildade (affischen) - vi är i händelsernas centrum, i handlingen. Det faktum att vi och människorna runt omkring oss äter med smutsiga händer och därmed kan skada vår hälsa är den verklighet som vi är inblandade i.

Vertikal vinkel. I ögonhöjd

Samma faktum bekräftas av skottvinkeln, eller snarare av dess frånvaro. Vår bild togs framifrån och utan någon vinkel. Varken över eller under, utan direkt - i nivå med våra ögon, som om vi är i samma höjd som karaktären (killen). Därför har den här killen och jag ingen relationsskillnad (förringande eller upphöjande). En trevlig och vänskaplig relation utvecklas mellan bilden och betraktaren – som om vi vore vänner eller bekanta, vilket påverkar graden av godtrogenhet och jämlikhet.

Inte bara de dysfunktionella eller, omvänt, kända och mäktiga människor äter med smutsiga händer, utan alla människor kan utföra en liknande handling.

Arrangemang av objekt i bilden

Vänster höger

På vänster sida av bilden finns element (deltagare) som är givet, något allmänt känt, bekant, igenkännbart. Det vi först och främst lägger märke till när vi tittar på bilden är vad som måste fortsätta på höger sida och liksom pekar på det. I det här fallet ser vi den välkända hamburgaren som den är, faktum är fräsch, aptitretande ... På vänster sida finns en smutsig handsneaker, såväl som en given, eftersom det är ett faktum att i modern värld, med en aktiv livsstil, kan våra händer helt enkelt inte förbli helt rena (plus att de flesta knappt äter hamburgare hemma till middag, hamburgare - snabbmat, vad vi äter "på gatan", på ett snabbt sätt). Därför anger kopplingen mellan hand-kedan och hamburgaren på vänster sida av bilden det faktum att vi tar mat med våra smutsiga händer och därmed... Vi går till höger sida - vi äter (i oss själva). På höger sida ser vi en ung man - det här är det viktigaste på bilden som VI MÄNNISKOR äter med smutsiga händer. Personen är huvudinformationen, utan honom var vi bara en smutsig hamburgare ... Tja, smutsig, så vad!? Och i det här fallet, på höger sida, hittar vi nyckelinformation - personen som ska äta samma hamburgare - i framtiden. I framtiden kommer han att äta smutsig mat och det är möjligt att han kommer att må dåligt, han kan vara i fara. Vi ser också en rörelse som sker från vänster till höger, precis så, för för de flesta människor på planeten är detta bekant, eftersom vi skriver och läser från vänster till höger. Det är relevant, om författaren tänker så, rörelse in i framtiden, vanligtvis positiv. När vi rör oss från höger till vänster kanske vi märker den motsatta effekten riktad mot det förflutna - negativ.

Översta botten

Den övre delen av bilden, liksom den högra delen, är mer betydelsefull, vägande i bilden. Toppen är ett idealiserat område, vad kunde ha varit, bra, bättre, gynnsamt ... När vi tittar på bilden ser vi först och främst vad som är till vänster och ovan, när vi börjar läsa uppifrån och till vänster. Det visar sig att det övre vänstra hörnet är det allra första och mest iögonfallande. Men enligt idén med denna reklamaffisch dominerar handlingen fortfarande i vårt land, och inte själva produkten. Därför ser vi först handlingen, och sedan märker vi själva produkten som ett svar, eftersom det vi behöver är en lösning. Sanitetsbindor - som vad du kan ha, och om du alltid har dem till hands - det är perfekt ...

Nederst på bilden saknas några element, förutom den synliga delen av killens kropp och skjortan. Elementen som finns längst ner i bilden är inte de viktigaste, utan kompletterande, mer verkliga och vardagliga, stabila och slutgiltiga. Jag tror att inget viktigt från botten användes medvetet i denna reklamaffisch, eftersom botten väcker dåliga associationer. Även skjortan på killen är i en neutral grå färg, nästan smälter samman med bakgrunden. Jag tror att botten inte betyder något i det här fallet.

Om vi ​​överväger det geometriska mitten av kompositionen, så är det i denna reklamaffisch som den viktigaste åtgärden äger rum - processen med medzhu med handen, som innehåller hamburgaren och killen, det vill säga processen att äta . Vilket faktiskt är huvudidén - vi äter med smutsiga händer och för att undvika skador på kroppen är det nödvändigt att tvätta händerna eller torka dem med sanitetsbindor, som annonseras. Kompositionscentrum är huvudidén, kärnan i kompositionen.

Denna komposition är inte helt central eller centrisk (huvudelementen är i centrum, och hjälpelementen är runt den), därför det enda hjälpelementet som kompletterar och hjälper till att avslöja essensen av det centrala, dominerande elementet (i termer av åtgärdens omfattning och aktivitet) är den annonserade produkten - servetter. Vi "läser" typ det viktigaste, handlingen och sedan servetterna "prickar i:et" och hjälper till att äntligen förstå idén med bilden.

Att redigera bilder och skapa collage skulle vara ganska spännande om du inte behövde lägga större delen av din tid på noggrann märkning av objekt. Uppgiften blir ännu svårare när objektens gränser är suddiga eller det finns transparens. Photoshop-verktyg som magnetlasso och trollstav är inte särskilt smarta eftersom de bara fokuserar på bildfunktioner på låg nivå. De returnerar hårda (Hårda) gränser, som sedan måste korrigeras manuellt. Adobes Semantic Soft Segmentation-metod hjälper till att lösa denna skrämmande uppgift genom att dela upp en bild i lager som motsvarar semantiskt signifikanta områden och lägga till mjuka övergångar vid kanterna.

"Mjuk" segmentering

En grupp forskare från CSAIL-laboratoriet vid MIT och det schweiziska universitetet ETH Zürich, som arbetar under Yagyz Aksoys ledning, föreslog ett tillvägagångssätt för detta problem baserat på spektral segmentering, och lade till moderna framsteg inom djupinlärning. Med hjälp av textur- och färginformation, samt extraherade semantiska egenskaper på hög nivå, byggs en graf av en speciell typ från bilden. Sedan byggs Kirchhoff-matrisen (laplacisk matris) från denna graf. Genom att använda spektral nedbrytning av denna matris genererar algoritmen mjuka konturer av objekt. Bilddelningen i lager som erhålls med hjälp av egenvektorer kan sedan användas för redigering.

Översikt över det föreslagna tillvägagångssättet

Modellbeskrivning

Låt oss överväga metoden för att skapa semantiskt signifikanta lager steg för steg:

1. Spektral mask. Det föreslagna tillvägagångssättet fortsätter arbetet av Levin och hans kollegor, som först använde Kirchhoff-matrisen i problemet med automatisk maskkonstruktion. De byggde en matris L, som definierar den parvisa likheten mellan pixlar i något lokalt område. Genom att använda denna matris minimerar de den kvadratiska funktionella αᵀLα med användarspecificerade begränsningar, där α anger vektorn för transparensvärden för alla pixlar i ett givet lager. Varje mjuk kontur är en linjär kombination av K egenvektorer som motsvarar de minsta egenvärdena av L, vilket maximerar maskens så kallade sparsitet.

2. Färgaffinitet. För att beräkna tecken på icke-lokal färgnärhet genererar forskarna 2 500 superpixlar och uppskattar närheten mellan varje superpixel och alla superpixlar i grannskapet med en radie på 20 % av bildstorleken. Att använda icke-lokal närhet säkerställer att områden med mycket liknande färger förblir sammanhängande i komplexa scener som den nedan.

Icke-lokal färgnärhet

3. Semantisk affinitet. Detta steg låter dig välja semantiskt sammankopplade områden i bilden. Semantisk närhet uppmuntrar sammanslagning av pixlar som hör till samma scenobjekt och straffar sammanslagna pixlar för olika objekt. Här drar forskarna nytta av tidigare framsteg inom mönsterigenkänning och beräknar, för varje pixel, en funktionsvektor som korrelerar med pixelns objekt. Funktionsvektorer beräknas med hjälp av ett neuralt nätverk, som vi kommer att diskutera mer i detalj nedan. Semantisk affinitet, liksom färg, definieras i termer av superpixlar. Men till skillnad från färgaffinitet länkar semantisk affinitet endast de närmaste superpixlarna, vilket uppmuntrar skapandet av koherenta objekt. Kombinationen av icke-lokal färgnärhet och lokal semantisk närhet gör det möjligt att skapa lager som täcker bilderna av ett fragment av ett semantiskt relaterat objekt (till exempel vegetation, himmel, andra typer av bakgrund) som är bortkopplade i rymden.

Semantisk affinitet

4. Skapa lager. I detta steg, med hjälp av den tidigare beräknade närheten, konstrueras matrisen L. Från denna matris extraheras egenvektorerna som motsvarar de 100 minsta egenvärdena och sedan tillämpas gleshetsalgoritmen som extraherar 40 vektorer från dem, längs vilken skikten är konstruerade. Sedan reduceras antalet lager igen med hjälp av k-means klustringsalgoritmen vid k = 5. Detta fungerar bättre än att bara glesa 100 egenvektorer till fem, eftersom en sådan drastisk minskning av dimensionen gör att problemet åsidosätts. Forskarna valde det slutliga antalet konturer till 5 och hävdar att detta är ett rimligt antal för de flesta bilder. Detta nummer kan dock ändras manuellt beroende på vilken bild som bearbetas.


Mjuka konturer före och efter gruppering

5. Semantiska funktionsvektorer. För att beräkna den semantiska närheten användes funktionsvektorer, beräknade med hjälp av ett neuralt nätverk. Det neurala nätverket är baserat på DeepLab-ResNet-101, tränat på det metriska prediktionsproblemet. Under träningen uppmuntrades maximering av L2-avståndet mellan egenskaperna hos olika objekt. Således minimerar det neurala nätverket avståndet mellan funktioner som motsvarar en klass och maximerar avståndet i ett annat fall.

Kvalitativ jämförelse med liknande metoder

Bilderna nedan visar resultaten av det föreslagna tillvägagångssättet (märkt "Vårt resultat") i jämförelse med resultaten av den närmaste mjuka segmenteringsmetoden - spektralmaskeringsmetoden - och två toppmoderna semantiska segmenteringsmetoder: PSPNet-scenen bearbetningsmetoden och objektsegmenteringsmetoden Mask R-CNN.


Kvalitativa jämförelser av mjuk semantisk segmentering med andra tillvägagångssätt

Det kan ersättas att PSPNet och Mask R-CNN är benägna att göra fel vid objekts gränser, och mjuka konturer konstruerade med spektralmetoden går ofta utanför objektens gränser. Samtidigt täcker den beskrivna metoden objektet helt, utan att kombinera det med andra, och uppnår hög noggrannhet vid kanterna och lägger till mjuka övergångar där det behövs. Det bör dock noteras att de semantiska egenskaperna som används i denna metod inte skiljer mellan två olika objekt som tillhör samma klass. Som ett resultat presenteras flera objekt på ett lager, vilket kan ses i exemplet med bilder av giraffer och kor.

Redigering av bilder med mjuka semantiska konturer

Nedan finns några exempel på hur man använder mjuka banor för att redigera bilder och skapa collage. Mjuka banor kan användas för att tillämpa specifika redigeringar på olika lager: lägga till rörelseoskärpa (2), separata färgjusteringar för personer och bakgrunder (5, 6), separat styling för ballong, himmel, landskap och person (8) ... Naturligtvis kan samma sak göras med manuellt skapade masker eller klassiska algoritmer för konturval, men med automatiskt urval av semantiskt signifikanta objekt blir sådan redigering mycket lättare.

Använder mjuk semantisk segmentering för bildredigering

Slutsats

Denna metod skapar automatiskt mjuka konturer som motsvarar semantiskt signifikanta områden av bilden med hjälp av en blandning av högnivåinformation från det neurala nätverket och lågnivåfunktioner. Denna metod har dock flera begränsningar. För det första är det relativt långsamt: bearbetningstiden för en 640 x 480 bild är 3-4 minuter. För det andra skapar den här metoden inte separata lager för olika objekt i samma klass. Och för det tredje, som visas nedan, kan denna metod fel i de inledande stadierna av bearbetningen i fall där färgerna på objekt är mycket lika (översta exemplet), eller när man kombinerar mjuka banor nära stora övergångsområden (nedre exemplet).

Algoritmfelsfall

Men de mjuka banorna som skapas med den beskrivna metoden ger en bekväm mellanrepresentation av bilden, vilket gör att du kan spendera mindre tid och ansträngning när du redigerar bilder.

PRINCIPER FÖR ATT KONSTRUERA SEMANTISKA KOMMENTARER AV BILDINNEHÅLL

PRINCIPER FÖR ATT ANNOTERA BILDINNEHÅLLET

T.EX. Sokolova ( [e-postskyddad])
Computing Center för den ryska vetenskapsakademin A.A. Dorodnitsyna

M.V. Boldasov ( [e-postskyddad])
Ryska forskningsinstitutet för artificiell intelligens

Artikeln diskuterar principerna för att skapa semantiska kommentarer för att beskriva innehållet i bilder av scener av diskreta objekt, representerade av fotografier av öppna utrymmen - stadsvyer, landskap. Anteckningar skapas baserat på ontologin av begrepp för en given domän i form av XML-representationer. Anteckningar beskriver det statiska innehållet i bilder, inklusive bildkomposition. Formaliserade anteckningar kan användas både för att söka information, till exempel i biblioteks- och museisamlingar av bilder, och för att generera naturliga språkbeskrivningar av bilder, både generella och på användarens begäran. Under de senaste åren har informationssystem och kataloger skapats på Internet för att söka information i arkiv som innehåller data av olika karaktär - texter, bilder, ljud, i detta fall görs sökningen på begäran på olika språk. Ett exempel på ett sådant informationssystem är det internationella informationsnätverket för kulturarv i Europa, etablerat av BRICKS-gemenskapen (BRICKS, 2004). Systemet innehåller en sökning efter information om museiföremål, inklusive konstverk. Att hitta information om bilder är också relevant för fotomuseer. Förutom att söka på bibliografiska data är det viktigt att söka bilder på deras visuella parametrar och på bildens innehåll, d.v.s. enligt de objekt som visas.

Tre sätt används för att beskriva innehållet i bilder i samlingar: Natural Language (NL) textkommentarer, nyckelord och en lista med objekt.

Textanteckningar har tre nackdelar: a) användningen av ett specifikt NL gör det svårt att söka mellan språk; b) uttryck i NL är ofta tvetydiga; c) för att jämföra texten i frågan för NL och sökbilden krävs icke-triviala operationer. Till exempel, i (Emeljanov et al., 2000) föreslås det att söka efter bilder med textkommentarer, och att övervinna analysens variation genom att utföra likvärdiga transformationer av texten. Denna metod förutsätter lösningen av två svåraste uppgifter - skapandet av moduler för analys och semantisk tolkning av meningar av fri text, såväl som apparaten för att parafrasera meningar av fri text. Dessa uppgifter är fortfarande på forskningsstadiet.

En uppsättning nyckelord är den enklaste och mest universella formen för att beskriva innehållet i dokument, inklusive bilder. Denna blankett används överallt, inklusive i BRICKS. Det låter dig övervinna flerspråkighet genom att specificera överensstämmelse mellan deskriptorer på olika språk. Vanligtvis har en samling ett eget, ibland delvis strukturerat, indexeringsschema (Hollink et al., 2003). Nyckelord definierar dock bara ämnet för dokumentet, inte dess innehåll.

Listan över avbildade föremål används i det statliga historiska biblioteket i Moskva. Detta är en mer meningsfull beskrivning än nyckelord, men den tillåter dig inte att söka efter grupper av föremål som står i ett visst samband med varandra, till exempel tvåvåningshus vid floden, en man som sitter nära ett bord i en frack och bowlerhatt osv. Att utöka listorna med objekt till sammanhängande semantiska anteckningar av bildinnehåll skulle göra det möjligt att organisera sökningen efter relaterade objekt i samlingen av semantiska kommentarer.

Artikeln presenterar resultaten av en studie av principerna för att konstruera formaliserade semantiska anteckningar för att beskriva innehållet i bilder. Beskrivningsmedlen är begrepp som betecknar typer av objekt, relationer mellan objekt, samt egenskaper hos objekt och deras värden. Begreppen är samlade i den experimentella modellen för ontologin av begreppen i den synliga världen som skapats av författarna.

Ontologikoncept är delar av semantiska bildkommentarer representerade i XML-formalism. Materialet för denna studie var fotografier av stads- och landsbygdsområden, naturlandskap tagna från marken eller från en liten kulle - en bro, ett berg, ett hustak, etc., insamlade av olika människor från olika källor - print, Internet, hemarkiv.

Bildsemantik

Vi kommer att hänvisa bilderna av öppen plats till klassen av bilder, som vi kommer att kalla "scener av diskreta objekt" (SDO). Denna klass kännetecknas av det faktum att bakom bilden finns en struktur av avbildade objekt såsom nätverksramar, som organiserar objekten som deltar i den till en slags rationell scen. Denna scen kan beskrivas i termer av objekt och deras egenskapsvärden, såväl som rumsliga relationer mellan objekt. När vi skapar en semantisk anteckning av en bild använder vi de begrepp som folk använder när de beskriver en bild på NL. De där. beskrivningarna i fråga är antropocentriska

Erfarenhet visar att olika personer, som beskriver en bild, uppmärksammar olika föremål, därför kan ITS beskrivningar av samma foto av olika personer skilja sig avsevärt, d.v.s. mänskliga beskrivningar av bilder är subjektiva. Till exempel, här är två beskrivningar av innehållet i fotografiet som visas i fig. 1:

(Beskrivning 1) Bilden visar en sommardag efter ett åskväder.

I förgrunden är floden. Av skjutpunkten att döma är bilden tagen från en båt eller från en bro. Bankarna är jämna, kanske är detta inte en flod, utan en kanal. Åskvädret är troligen antingen på väg att börja eller har precis tagit slut: luckor är synliga på den molniga himlen, gräset är upplyst av solen. En regnbåge syns på himlen.

Till vänster, på stranden, finns ett stort trevåningshus med rött tak.

(Beskrivning 2) Målningen föreställer ett lantligt landskap: en flod, dess två stränder, en grå himmel. Det finns ett litet vitt hus på flodens vänstra strand. Det finns inga andra hus att se, huset står ensamt mitt bland gröna träd. Det finns en båt nära vänstra stranden. En mångfärgad regnbåge bryter igenom de grå molnen.

I Beskrivning 1 kallas huset "stort", uppenbarligen tänkte författaren på lanthus, för vilka ett trevåningshus är ett stort. Beskrivning 2 avser samma objekt som ett "litet hus". Kanske är författaren en medborgare och för honom är alla hus på landet små. I Beskrivning 2, bland de avbildade föremålen, nämns en båt vid vänstra stranden, i Beskrivning 1 - ej. Båda beskrivningarna, börjar med presentationen av målningen, listar sedan föremålen, med början på floden, som är central i målningen. Men sedan implementeras motsatta strategier: i Beskrivning 1 diskuteras himlen och slutar med ett hus, medan Beskrivning 2 börjar med ett hus och slutar med himlen.

Uppgiften att skapa den mest objektiva beskrivningen i form av en semantisk anteckning innebär att om möjligt lista alla avbildade objekt som är potentiellt intressanta för användaren baserat på objektiva data av olika typer, i synnerhet:

- äkta släkting storleken på objektet i bilden, till exempel den del av bildytan som upptas av objektet i förhållande till hela bildens eller ett annat objekts yta;

Perspektiv - minska storleken på föremål med avstånd från observatören;

Kunskap om enheten, relativ storlek (till exempel jämfört med storleken på en person) och funktionalitet hos objekt.

Skillnaderna i beskrivningarna i föregående exempel hänger samman med valet av olika presentationsstrategier och med att olika personer förlitat sig på olika kunskaper om sitt ämnesområde (SO) vid beskrivningen av bilden. Därför kan vi anta att beskrivningen av bilden är objektivt relativ till dess mjukvara. Vi representerar mjukvara "open space" inom ontologi.

Ontologi

I den föreslagna ontologimodellen presenteras de begrepp som används för att beskriva objekten som utgör bilderna av öppna ytor, med uppräkningen av typer och egenskaper hos objekt som särskiljs av en person och relationerna mellan dem. Begreppen ontologi definieras av dess artiklar. Ontologiartikeln består av följande avsnitt:

rubrik- matcha konceptet med en ontologi för ett identifierande ord som anger typen av objekt i bilden (till exempel konceptet husvägg, man, bild);

informell definition - Textbeskrivning på NL av innehållet i detta koncept;

släkte- begreppet en given ontologi, som är generisk i förhållande till en given;

se- uppräkning av begreppen för den givna ontologin, vilka är specifika i förhållande till den givna;

attributvärden, som är fixerade i artikelontologin för ett givet begrepp,

ontologiska relationer - representerar kunskap om objekts struktur och funktionalitet, samt om det typiska arrangemanget av objekt, (t.ex. del, plats) ;

stabila visuella egenskaper bilden av själva objektet, till exempel bilden, strukturen, formen, färgschemat, medan det bara anges ibland i form av en informell kommentar. Det ökade intresset och försöken att skapa en ontologi för bildsemantik, till exempel (Hunter, 2001), (Beloozerov et al., 2005), gör att vi i framtiden kan hoppas på utveckling av forskning om igenkänning av objekt i bilden.

Ontologin innehåller en hierarki av öppna utrymmeskoncept för att konstruera bildinnehållsanteckningar. Hennes artiklar är helt oberoende av språklig semantik, eftersom de innehåller begrepp representerade av bilder. I roten till ontologin finns tre typer av begrepp: - bild, relation, attribut. Bild– Det här är det mest allmänna konceptet, som inkluderar själva bilden och dess delar och de typer av objekt från den verkliga världen som avbildas i bilden. Nedan finns flera artiklar om ontologi.

Relationinkluderar ontologiska och rumsliga relationer. Rumsliga relationer (t.ex. precis ovanför), förmedla den relativa positionen för objekt i bilden från betraktarens synvinkel. De används i scenbeskrivningar - semantiska kommentarer av bilder.

Attribut beskriva objektens egenskaper och tillstånd. Information om tillståndet kan erhållas från analysen av den visuella bilden, t.ex. stående (person), sittande (katt, fågel)... Således är attributtyperna utsträckta över den uppsättning som vanligtvis används i semantisk forskning. Förutom de "klassiska" egenskaperna eller attributen kan t.ex. färg, storlek, Attribut inkluderar begrepp som vanligtvis uttrycks av verb, t.ex. löpning... I ontologi representeras de som attributvärden för en objekttyp utgör.

Rotobjektet för ontologin är begreppet "bild":

(BILD

(DEFINITION("Bild som en enhet av media och innehåll"))

(SLÄKTE (*))

(SE(MEDIA BILD VIKTIGT)))

(MEDIA BILD

(DEFINITION("Bild som en samling pixlar"))

(SLÄKTE(BILD))

(SE(FOTOBILD))

(DEL(BILD-KANT BILD-DEL (mitten, övre vänstra hörnet, etc.) BILD FRAGMENT LINE))

(BILD

(DEFINITION("En bild som uppfattas av synen på en plan yta är en bild, fotografier, eftersom innehållet är en konfiguration av presenterade objekt."))

(SLÄKTE(BILD))

(SE(ÖPPET RYMD (liggande)

STÄNGT UTRYMME (hushållsscen)

BILDOBJEKT (stilleben)

IMAGE-MAN (porträtt) SPECIAL-IMAGE (medicinsk, till exempel, cytologisk, läkemedel, fotografi av jordens yta från rymden)))

(DEL(GEO-OBJECT OBJECT))

(GEOOBJEKT T

(DEFINITION"objekt av planetarisk skala som finns ontologiskt närvarande i alla bilder av öppet utrymme")

(SLÄKTE(BILD))

(SE(YTA-JORDS HIMMELHORISONT))

(MARKYTA

(DEFINITION("Den del av det öppna utrymmet där alla OBJEKT finns))

(SLÄKTE(GEO-OBJEKT))

(SE(TORRT VATTEN))

(HELA(ÖPPET UTRYMME))

Objektklassificering inkluderar allt som kan finnas i bilden - hus, reservoarer, vägar, gräsmattor, bilar, växter, sol, etc. I beskrivningarna av bildernas innehåll användes till exempel den allmänna språkontologin WordNet (WordNet) (Hollink et al.). I vår ontologi finns det färre begrepp än i allmänna språkontologier, till exempel finns det inga abstrakta begrepp av typen idé, öde, smart, etc., men det kan finnas abstrakta attribut som ålder eftersom de relaterar till utseendet på objektet i bilden. Den saknar också verb, vars värden i liten utsträckning täcks av attributets värden utgör... Dessa begränsningar är naturliga - de åläggs av det visuella sättet för människans uppfattning om världen under naturliga förhållanden.

WordNet innehåller redan många av de koncept som behöver införlivas i en open space-ontologi. Men artiklarna som beskriver dem kan inte bara kopieras. WordNet följer en filosofisk tradition (Vossen, 2003), d.v.s. spekulativ, inte visuell kontemplation av världen. De innehåller mycket onödig information och innehåller inte en del av den information du behöver. Till exempel, av de sju betydelserna av substantivet Earth (jord) i WordNet, motsvarar bara två de begrepp vi behöver, dessa är:

[S: (n) jord, mark (det lösa mjuka materialet som utgör en stor del av landytan) "de grävde i jorden utanför kyrkan"].

[S: (n) land, torrt land, jord, mark, fast mark, terra firma (den fasta delen av jordens yta)" planet vände bort från havet och flyttade tillbaka över land ";" jorden skakade i flera minuter ";" tappade han stockarna på marken "]

Den första betecknar jorden som ett material, t.ex. högen landa ... Det andra visar sig vara för vagt, i synnerhet exemplet på användning som ges i WordNet:

"Har instans

S: (n) Amerika (Nordamerika och Sydamerika och Centralamerika) "

kan hänvisa till programvara "bilder från rymden", men inte från marken. De angivna direkta artbegreppen av den andra betydelsen, inklusive sådana begrepp som är relevanta för programvara "öppet utrymme sett från marken" som:

S: (n) vid stranden (en landremsa som löper längs en strand) S: (n) kustslätten (en slätt som gränsar till en kust),

och indirekt:

S: (n) skog, skogsmark, timmermark, timmer (mark som är täckt av träd och buskar),

innehåller inte många relevanta begrepp som t.ex , väg, gräsmatta etc. såväl som alla vattendrag (vatten) - flod, hav, pool etc., som också representerar jordens yta som är synlig för människor. Många av dessa begrepp representeras i WordNet genom sin funktionella aspekt och innehåller därför ingen indikation på att detta är jordens yta, till exempel en väg:

S: (n) väg, rutt (en öppen väg (i allmänhet offentlig) för resor eller transport)

S: (n) väg (ett sätt eller medel för att uppnå något) "vägen till berömmelse"

Vår ontologi ligger närmare ontologier som löser problem relaterade till representationen av en viss texts betydelser. Dessa inkluderar i synnerhet ontologier för kunskapsbaserad maskinöversättning (KBMT), till exempel (Nirenburg, Raskin, 2004). Ett utmärkande drag för sådana ontologier är närvaron av syntagmatiska semantiska relationer - de som förmedlar förhållandet mellan objekt i beskrivningar. Det är aktantrelationer som Aktör, Mål, relationer mellan objekt, till exempel Lokalisering etc. Våra beskrivningar representerar en "förspråklig" bild. De innehåller inte predikat och relationer med deltagare, utan innehåller ontologiska och rumsliga relationer, t.ex. del, plats, ovan, höger.

I den första versionen av Ontology, sammanställd för 20 bilder, finns det upp till 20 attribut, 10 relationer och 100 objekt.

Beskrivning av scenen i termer av ontologi

I beskrivningen av scenen jämförs begreppen ontologi med deras instanser - objekt, prototyper av verkliga deltagare i scenen. Objekt är sammanlänkade genom relationer.

Att använda apparaturen för konceptuella (ontologiska) relationer för att beskriva innehållet och i synnerhet scener, N.N. Leontyev (Leontyeva, 2006). Till exempel följande uppsättning av två konceptuella relationer med fyllda platser:

plats (väg, bil)

höger (bil, person)

beskriv en scen som kan uttryckas i NL på olika sätt, till exempel ”Det står en bil på vägen. Till höger om den finns en person ", eller" Det finns en person på vägen. Till vänster om honom står en bil." Predikatet "stå" för att beskriva en given syn kan erhållas baserat på information om en persons hållning.

Bildabstrakt är antropocentriskt, d.v.s. fokuserat på de begrepp som en person använder för att beskriva bilder. En person uppfattar bilden omedelbart och fullständigt och förstår hur dess innehåll är uppbyggt. Beskrivningar på NL börjar vanligtvis med en allmän beskrivning av bilden, till exempel i (Beskrivning 1) - "sommardag efter ett åskväder", i (Beskrivning 1) - "bylandskap". En sådan allmän egenskap är resultatet av en omedelbar generalisering och bedömning av scenen av en person. Det kan dock ges av ett automatiskt system först efter en detaljerad analys av den semantiska annoteringen. Våra kommentarer inkluderar, om möjligt, alla avbildade objekt som användaren kan vara intresserad av, deras attribut och relationer.

När en person beskriver en bild, kombinerar en person de avbildade föremålen i grupper i enlighet med den komposition han förstår. För att beskriva kompositionen kommer vi att använda de begrepp som en person använder. Ett typiskt sätt att reflektera komposition är att använda planer ( lager Planer är grupper av objekt placerade på ungefär lika avstånd från betraktaren. Begreppet planer används i nästan alla beskrivningar av fotografier. Det sista planet längst bort från observatören är den allmänna bakgrunden (till exempel himlen, väggen eller skogen). Så på bilden som visas i fig. 2, den genomskinliga inskriptionen "Rosfoto Image collection" är i förgrunden, trottoaren och den gående personen på den är i bakgrunden, väggen är i bakgrunden.

Planerna ritar osynligt horisontella linjer på bilden, på vilka grupper av föremål på ungefär samma avstånd från observatören är placerade. Planer kan användas för att uppskatta storleken på föremål ur perspektiv. Förutom planer används flera objekt för att beskriva samlingar av objekt, som t.ex Skog, och grupper är objekt som underordnar andra objekt till sig själva i anteckningar, till exempel, en grupp människor (person-1, person-2, ... person-n), ett hus (tak, fönster, dörrar). Mellan roten av gruppen, till exempel Hus och underordnade objekt, till exempel, tak, det kan finnas ett ontologiskt samband, i detta fall, del... Rumsliga relationer kan upprättas med enskilda objekt i gruppen och med hela gruppen.

Objekt spelar olika roller för att beskriva innehållet i en bild. Stora föremål (vanligtvis geoobjekt), långsträckta i betraktarens synriktning, till exempel en väg, en flod (se fig. 1), kan delta i bildkompositionens bildande. Vanligtvis är ett sådant objekt placerat nära bildens mitt och delar upp det i tre delar - själva objektet, objekt till höger och vänster om det. I fig. 1 är en flod (eller kanal), vänstra stranden och högra stranden. Gruppobjekt kan också organiseras enligt planer, till exempel i beskrivningen av innehållet i bilden i fig. 1 vänstra strand kan delas in i tre planer: en bank med en branthet på 20%, bevuxen med gräs, på den ett trevåningshus med ett rött tak, ett träd till vänster om det (1 plan); träd (2 plan); en bank täckt med sand med en branthet på 5 %, träd på den och en båt på vattnet nära stranden (plan 3). Regnbågshimlen hänvisar till hela bildens bakgrund.

Syftet med anteckningen är inte att skapa en absolut fullständig beskrivning, utan att representera de objekt och relationer mellan dem som kan intressera användaren. I händelse av att beskrivningen visar sig vara otillräckligt detaljerad kan anteckningen förfinas. Detta kräver inte en fullständig omarbetning av anteckningen. Du kan till exempel lägga till attribut och beroende objekt till ett gruppobjekt utan att påverka resten av bilden. Numeriska egenskaper kan matas in i beskrivningen, såsom uppskattningar av objektets storlek, kustens eller klippans branthet, som gjorts ovan. Nedan finns en ungefärlig XML-representation av innehållet i fotografiet som visas i Fig. 1:

xml version = "1.0" encoding = "windows-1251"?>

- < bild-id=" bild 1">

< v-objekt begrepp=" FLOD" id=" flod-1" />

- < vänster-v-objekt koncept=" KUST" id=" strand-1">

- < lager-id=" lager-1">

< fast egendom begrepp=" BELÄGGNING" menande=" GRÄS" />

< fast egendom begrepp=" Svalka" menande=" 20 " />

- < objekt koncept=" HUS" id=" hus-1">

< fast egendom begrepp=" FÄRG" menande=" Vit" />

- < objekt koncept=" TAK" id=" tak-1">

< fast egendom begrepp=" FÄRG" menande=" RÖD" />

objekt>

- < objekt koncept=" RAD- OKON" id=" floo-1">

< fast egendom begrepp=" SIFFRA" menande=" 3 " />

objekt>

< objekt begrepp=" trä" id=" träd-1" />

objekt>

lager>

- < lager-id=" lager-2">

- < objekt koncept=" TRÄ" id=" träd-1">

< fast egendom begrepp=" SIFFRA" menande=" VISSA" />

objekt>

lager>

- < lager-id=" lager-3">

< fast egendom begrepp=" BELÄGGNING" menande=" SAND" />

< fast egendom begrepp=" Svalka" menande=" 5 " />

- < objekt koncept=" EN BÅT" id=" båt-1">

< fast egendom begrepp=" FÄRG" menande=" VIT" />

objekt>

lager>

vänster-v-objekt>

- < höger-v-objekt koncept=" KUST" id=" strand-2">

< fast egendom begrepp=" BELÄGGNING" menande=" Bevuxen" />

höger-v-objekt>

- < lager-sista id=" lager-sista-1">

< objekt begrepp=" SKOG" id=" skog-1" />

- < objekt koncept=" HIMMEL" id=" himmel-1">

- < objekt koncept=" MOLN" id=" moln-1">

< fast egendom begrepp=" SIFFRA" menande=" VISSA" />

objekt>

< objekt begrepp=" REGNBÅGE" id=" regnbåge-1" />

objekt>

lager-sist>

- < relationer>

< relation typ=" vänster" domän=" hus-1" räckvidd=" träd-1" />

< relation typ=" Kontakt" domän=" strand-1" räckvidd=" båt-1" />

relationer>

bild>

Slutsats

Artikeln formulerar principerna för att skapa semantiska kommentarer av innehållet i bilder. Det har visat sig att enligt den antropocentriska principen är det möjligt att skapa en semantisk annotering av bildinnehållet baserat på ontologin för begreppen i denna programvara. Medlen för beskrivning är också gruppering av objekt, upprättande av rumsliga relationer mellan dem och användning av attribut som representerar, i synnerhet, några av de fysiska egenskaperna hos objektet i bilden, till exempel branthet (kust, klippor) . Annotering låter dig förfina egenskaper och sammansättning av objekt genom att lägga till egenskaper och objekt - medlemmar av en grupp av objekt eller en del av ett objekt. Anteckningar kan användas för informationssökning och för att söka efter ny information i arrayer av bilder, samt för automatisk generering av bildbeskrivningar i NL. Ontologi ger möjligheten att matcha begreppen stabila visuella egenskaper hos de avbildade objekten. Detta skulle göra det möjligt att i efterhand undersöka möjligheterna att känna igen objekt i bilder och att föreslå en formalisering av reglerna för att konstruera semantiska anteckningar av bilders innehåll.

Detta arbete stöddes delvis av den ryska stiftelsen för humaniora, anslag 04-04-00185a och den ryska stiftelsen för grundforskning, anslag 04-07-90187v.

Bibliografi:

1. Leontyeva N.N.Automatisk textförståelse: system, modeller, resurser.M .: "Akademin", 2006.

2. Beloozerov N.V., Murashov D.M., Trusova Yu.O., Yanchenko D.A. ... Söka efter lösningar i kunskapsbasen för bildanalys och bearbetning // Mönsterigenkänning och bildanalys: Framsteg inom matematisk teori och tillämpning. - MAIK “Nauka / Interperiodica”, 2005. - Vol. 15, nr 2. –P. 361-364.

3. TEGELSTENAR Projekt. Bygga resurser för Integrated Cultural Knowledge Services © 2004. // Europeiska kommissionens sjätte ramprogram (http://www.brickscommunity.org/)

4. Emeljanov G.V., Krechetova T.V., Kurashova E.P. Trädgrammatik i problemen med att söka efter bilder genom deras verbala beskrivningar // Mönsterigenkänning och bildanalys. - 2000. Vol. 10, N4. s. 520-526.

5. Hollink L., Shreiber G., Wielemaker J., Wielinga B ... Semantisk annotering av bildsamlingar // S. Handschuh, M. Koivunen, R. Dieng och S. Staab, redaktörer, Knowledge Capture 2003. Proceedings Knowledge Markup and Semantic Annotation Workshop, Florida, USA, oktober 2003. S. 41-48 ...Finns även på internet:

6. http://www.cs.vu.nl/~guus/papers/Hollink03b.pdf

7. Jägare j... Lägga till multimedia till den semantiska webben - bygga en MPEG-7-ontologi // Proceedings of International Semantic Web Working Symposium (SWWS), Stanford, 30 juli - 1 augusti 2001

8. ( http://archive.dstc.edu.au/RDU/staff/jane-hunter/semweb/paper.html).

9. Miller G.WordNet: en lexikalisk databas för engelska. Communications of the ACM, 38 (11): 39-41. WordNet: (http://wordnet.princeton.edu/)

10. Nirenburg, S., Raskin, V... Ontologisk semantik // Språk, tal och kommunikation. -MIT Press, 2004.

11. Vossen P.Ontologier // Oxfor d handbok i beräkningslingvistik. Ed. av R. Mitkov, Oxford univ. Tryck. 2003. sid. 464-482.







2021 gtavrl.ru.