I kvantitativ lingvistik analyserer man tekster ved at optælle, hvor hyppigt udvalgte ord og vendinger forekommer. Af de indsamlede tal forsøger man så at drage konklusioner ved brug af mere eller mindre avancerede statistiske metoder.
Kvantitativ lingvistik var selvsagt en træg affære før computernes tid, men nu er det helt anderledes. Enhver, der har en computer med netforbindelse, kan nu ganske let udføre kvantitativ lingvistik, endda uden brug af specielle programmer. Der er enorme mængder af tekster af alle slags på nettet, og det mest udbredte af alle søgeprogrammer, Google, kan finde og tælle de tekster, som bestemte ord og vendinger forekommer i. Det gælder blot om at stille et veldefineret spørgsmål og gå i gang. Lad os prøve.
Vi stiller spørgsmålet: Er alle politiske partier lige slemme til at bruge klichéer?
Klichéer
En kliché er en sproglig vending, en metafor eller en eufemisme, der fra oprindeligt at være morsom eller forfriskende, er blevet triviel og pinlig ved gentagen brug. Tænk blot på “set i bakspejlet”. Når man hører visse politikere tale og læser det, de skriver, kan man synes at deres sprog er vel rigeligt spækket med den slags vendinger.
For at undersøge, om denne fornemmelse kan bekræftes ved kvantitativ lingvistik, laver vi først en liste af klichéer, som vi har hørt politikere bruge. Derefter bruger vi Google til at tælle hvor mange tekster, der er skrevet af politikere fra forskellige partier, disse vendinger forekommer i. Listen, som man må huske, er et subjektivt input i undersøgelsen, kan se således ud:
på sigt, en bred vifte, vi som politikere, konkrete tiltag, laveste fællesnævner, med afsæt i, når det er sagt, sætte fokus på, tvingende nødvendigt, tage hånd om, bygge bro, økonomisk ansvarlighed, stå fast på, de svageste i samfundet, samfundets svageste, gøre det bedre, tilgodese, menneskesyn, i dansk politik, finde pengene, etnisk baggrund, ufinansierede, optaget af, omstrukturering, gå ind og, melde ud, bedre service, flere ressourcer, udsatte familier, pejlemærke og mærkesag.
Man må gå ud fra at de forskellige partiers hjemmesider er skrevet af politikere, der tilhører de pågældende partier. Teksterne i Venstres hjemmeside er skrevet i Venstres sprog, Socialdemokraternes hjemmeside er skrevet i Socialdemokraternes sprog o.s.v..
Søgninger
Med den antagelse går vi til computeren og skriver i Googles søgefelt: site: efterfulgt uden mellemrum af navnet på et politisk partis hjemmeside efterfulgt af et mellemrum og det ord vi vil efterspore. Hvis det er et udtryk. vi vil efterspore, skal det stå i gåseøjne. En sådan kommando, som kan se således ud, site:radikale.dk “på sigt”, vil starte gennemsøgning af alle tekster i Radikale Venstres hjemmeside for udtrykket “på sigt”, der var det første i vores klichéliste.
Der kommer lynhurtigt et svar i form af en liste over de tekster, hvor udtrykket på sigt forekommer. Oppe i højre hjørne står der, hvor mange tilfælde, der er fundet i alt. Det tal vil vi ikke bruge, fordi det er uverificerbart. I stedet bruger vi sidetalsmenuen forneden på svarsiden til at se, hvor mange svar vi kan få at se. Det viser sig altid at være et lavere antal end det tal, der er opgivet øverst til højre. Guderne og Google må vide hvorfor. Vi nøjes med at tælle de svar, som vi faktisk kan få at se ved hjælp af sidetalsmenuen forneden. Tallet kommer af sig selv, når listen er udtømt. Ved denne procedure finder vi at udtrykket “på sigt” er brugt i 105 verificerbare tekster i det Radikale Venstres hjemmeside. Man skal gøre sig klart, at tallet ikke inkluderer flere forekomster af udtrykket i den samme tekst. Da hjemmesiden jævnlig bliver opdateret, er det ikke sikkert, at man får helt det samme tal, hvis man prøver igen nogle dage senere.
Nu forestår der nogle timers arbejde med at indtaste hvert udtryk fra klichélisten i Googles søgefelt, hvor site:radikale.dk og gåseøjnene bliver stående fra gang til gang. Kun indholdet af gåseøjnene bliver skiftet ud. Når vi er færdig med de radikale kan vi gå over til Venstres hjemmeside ved at skrive site:venstre.dk “på sigt“ og så videre fremdeles. Hjemmesiderne for de øvrige partier, der er nået over vores spærregrænse hedder: socialdemokraterne.dk, konservative.dk, sf.dk, danskfolkeparti.dk og enhedslisten.dk. Derudover vil vi inkludere referater fra Folketingssalen i undersøgelsen. Det relevante site hedder ft.dk/dokumenter/tingdok.
Når vi er kommet igennem alle sites, har vi en stor tabel, der viser hvor mange gange hvert enkelt udtryk på listen forekommer i hvert enkelt partis hjemmeside og i Folketingets referater. Den tabel kan vi eventuelt taste ind i et regneark og lade det udregne summen af svar, der er fundet i hvert enkelt af de undersøgte hjemmesider. Disse summer er opført i tabellen nedenunder.
Sammenligningsgrundlag
Man kan ikke drage konklusioner ud fra disse tal, fordi forskellene mellem dem kan bero på forskelle i hjemmesidernes omfang. Jo flere og længere tekster jo større er sandsynligheden for at finde et bestemt udtryk. Vi må altså dividere hvert tal med den pågældende hjemmesides tekstomfang, før vi kan begynde at lave fortolkninger. Hjemmesidernes tekstomfang kan vi skaffe os mål for ved den samme metode, som vi brugte til at tælle forekomsten af udtryk fra klichélisten, blot skal vi ikke tælle klichéer, men almindelig ord og vendinger, som kan forekommer i enhver tekst som f.eks. “at kunne”. Vi laver altså en liste af sådanne almindelig ord og udtryk. Listen kan se således ud:
jeg tænker, jeg mener at, jeg tror at, jeg ved at, for to år siden, på samme måde, på trods af, blive ved med, hver dag, at kunne, man skal, det se ud til, overraskelse, med hensyn til, på forhånd, ved hjælp af, høj grad, er derfor, forhindret, mellem, skal ikke, naturligvis.
Læg mærke til, at man kan læse denne liste igennem uden at blive utilpas. Det kan man ikke med klichélisten. Hvis udtrykkene i listen er nogenlunde rigtigt valgt, vil summen af forekomsterne af udtrykkene i et partis hjemmeside være et mål for, hvor meget tekst hjemmesiden indeholder. Det er ikke et absolut mål, men tallene for de enkelte partier vil angive forholdene mellem teksternes omfang. Resultatet af optællingen af de almindelige ord og udtryk er nu opført i tabellens anden række:
Det viser sig, at Venstres hjemmeside blandt alle partihjemmesider er den, der har flest forekomster af almindelige ord og udtryk, hvilket viser, at den har det største teksteomfang. Heroverfor står Socialdemokraternes hjemmeside med de færreste forekomster og derfor det mindste tekstomfang. Det er værd at lægge mærke til, men rigtigt interessant bliver det, når vi dividerer hvert partis tal fra klichétællingen i første række med tallet fra tællingen af almindelig udtryk i anden række og får antal klichéer pr tekstenhed i hvert partis hjemmeside. Disse kvotienter er nu opført i tabellens tredje række.
Tallene viser, at der er store forskelle på klichéhyppighederne i de politiske partiers hjemmesider. Socialdemokraterne ligger i top og bruger næsten fem gange så mange klichéer pr tekstenhed som Dansk Folkeparti, der ligger i bund.
Klichéfilter?
Man kan sige det på den måde, at Socialdemokraterne har klichéer på alle hylder, mens Dansk Folkeparti kun har dem på den nederste hylde. Det er nærliggende at sætte denne iagttagelse i relation til Socialdemokraternes vedvarende tab af vælgere til Dansk Folkeparti. Det kan være fordi Socialdemokraterne udtrykker sig i et klichésprog, som vælgerne ikke gider høre på, mens Dansk Folkeparti udtrykker sig i et mere dagligdags sprog. Det bliver Helle Thorning-Schmidt nok nødt til at gøre noget ved. En nærliggende forholdsregel, ville være at få installeret klichéfiltre i alle Socialdemokraternes tekstbehandlingsprogrammer, men det vil kun løse en del af problemet, for man kan ikke sætte sådan en anordning på en politikers mund.
Den forholdsvis høje klichéhyppighed, som vi fandt i Folketingets referater, antyder, at folketingets medlemmer bruger det samme sprog i folketingssalen, som bruges i deres respektive partiers hjemmesider. Hvis vi antager, at de forskellige politikerne taler med samme klichéhyppighed i Folketinget, som de skriver i deres hjemmesider, og de alle sammen taler lige meget, må klichéhyppigheden i Folketingsreferaterne være lig med det efter mandatfordelingen vægtede gennemsnit af de målte klichéhyppigheder for de forskellige partier. Den vægtede gennemsnitsklichéhyppighed udregner vi til 0.51. Det er i rimeligt god overensstemmelse med klichéhyppigheden 0,54 fundet i folketingsreferaterne.
Fagsprog?
Nogle vil måske mene, at den klichéliste vores undersøgelse er baseret på, hellere skulle kaldes en liste over politiske fagudtryk. Ethvert fag har sit eget fagsprog, og det har politikerfaget selvfølgelig også, og hvor skulle de tale deres fagsprog hvis ikke i Folketingssalen. Men et fagsprog er til intern og ikke ekstern brug. Lægen taler ikke latin med sine patienter og en sømand siger ikke dørken til en landkrabbe. Hvor mange gange har vi ikke hørt en styrmand sige i højtaleren: “Landgangen er i skibets højre side i sejlretningen“, selvom han kunne bruge et ganske kort fagudtryk. Hvis det, vi her har kaldt klichéer, bare er politiske fagudtryk, behøver vi en forklaring på, hvorfor politikerne bruger deres fagsprog, når de henvender sig til folk udenfor faget. Vi må jo tro, at hjemmesiderne henvender sig til offentligheden.
Bredere sammenligning
Vi har på forhånd antaget, at politikere bruger udtrykkene i klichélisten hyppigere end andre mennesker. Det er ikke bevist med de undersøgelser, der er beskrevet ovenfor. Det må vi altså efterprøve. Vi stiller spørgsmålet:
Er de klichéhyppigheder, vi finder i de politiske partiers hjemmesider og i folketingsreferaterne store eller små sammenlignet med dem, vi kan finde i tekster uden for den politiske sfære?
Det spørgsmål vil vi søge besvaret ved at vælge nogle tilfældige ikke-politiske hjemmesider og gennemsøge dem for alle udtrykkene i vores klichéliste og listen over almindelige udtryk. Vi vælger at søge i hjemmesiderne for fagbladene Landbrugsavisen, Socialrådgiveren, Ingeniøren og dagbladene Ekstrabladet, Jyllandsposten og Politiken.
Her støder vi på et teknisk problem. Disse seks hjemmesider er af meget forskellig størrelse. Nogle af dem giver flere svar på et enkelt udtryk end de ca. 800-1000, som Google maksimalt lader komme frem på svarsiderne. Afskæringsgrænsen er ikke konstant, men man er på den sikre side, hvis man begrænser de gennemsøgte tekster således at svartallet ikke overstiger ca. 800. Begrænsningen foregår ved hjælp af en facilitet i Google, hvormed man kan bestemme en tidsramme for søgningen. Ved at prøve os frem finder vi, at problemet ikke opstår ved søgning i Landbrugsavisen og Socialrådgiveren, men i de fire andre tilfælde må der specificeres en passende tidsramme.
Resultatet af optællingerne er givet i tabellen nedenfor. Hvor der har været brugt tidsramme, er denne angivet. Første række er summerne af forekomsterne af klichélistens udtryk. Anden række er summerne af forekomsterne af de almindelig udtryk. Tredje række er kvotienterne, der angiver antallet af klichéer pr tekstenhed.
Vi ser, at Landbrugsavisen, Socialrådgiveren og Jyllandsposten ligger på niveau med Dansk Folkepartis hjemmeside, hvor vi fandt den laveste klichéhyppighed blandt de politiske partier, mens Ingeniøren, Ekstrabladet og Politiken ligger langt lavere.
Man ville nok have ventet at finde, at ingeniører ikke slynger om sig med klichéer, men at Politiken og Ekstrabladet ligger lige så lavt som Ingeniøren, er lidt uventet. Svaret på det stillede spørgsmål er utvetydigt. Politikere bruger mange flere klichéer end andre. I hvert fald de klichéer, som er optaget i vores liste.
Partiernes foretrukne klichéer
Når vi nu er i gang, så kunne det også være interessant at vide, om der er forskel på de forskellige politiske partiers valg af klichéer. Det lader sig aflæse direkte af de detaillerede optællingsresultater, som ikke er gengivet her. I tabellen nedenfor har vi angivet i prioriteret rækkefølge de seks mest benyttede klichéer i hvert politisk partis hjemmeside og i Folketingets referater.
Vi ser, at alle syv partier har “på sigt”, seks partier har “sætte fokus på”, seks partier har “optaget af“, fire partier har “etnisk baggrund”, fire partier har “flere ressourcer”, tre partier har “økonomisk ansvarlighed”, tre partier har “mærkesag”, to partier har “bedre service” og to partier har “i dansk politik” blandt deres seks yndlingsklichéer.
Kun fire udtryk: “pejlemærke”, “menneskesyn”, “tilgodese” og “tage hånd om” forekommer kun hos et parti. Disse udtryk bruges dog også af de øvrige partier, blot længere nede på prioritetslisten.
På baggrund af tabellen må man konkludere, at der ikke er nogen nævneværdig forskel på de forskellige partiers klichévalg i deres hjemmesider, og det er de samme klichéer, der benyttes i Folketingssalen som i hjemmesiderne.
Forskellene mellem partiernes sprogbrug ligger ikke i klichévalget men i klichéhyppigheden. Nogle partier bruger det fælles klichégods langt mere end andre.
Vi foretog denne undersøgelse for at få svar på spørgsmålet: Er alle politikere lige slemme til at bruge klichér?
Formuleringen af spørgsmålet afspejler en negativ holdning til brug af klichéer. Denne negative holdning har forhåbentlig ikke haft ubevidst indflydelse på undersøgelsens resultat. Den eneste måde, det kunne ske på, ville være i valget af udtryk til klichélisten. Det står enhver frit for at gentage undersøgelsen med andre valg af klichéer og se om resultatet bliver anderledes. Det er vanskeligere at forestille sig, at den metode, der er brugt, kan være tendentiøs, men den kan være behæftet med fejl. Af den grund er metoden forklaret i detaljer, og det står igen enhver frit for at undersøge, om den er fejlbehæftet.
Med de forbehold kan vi sige, at undersøgelsen har givet et klart svar på det stillede spørgsmål. Socialdemokraterne er storforbrugere af klichéer og Dansk Folkeparti er minimalforbrugere, men ligger alligevel langt foran ikke-politikere i klichéforbrug. I tillæg har vi fundet ud af, at alle partier bruger de samme klichéer i deres hjemmesider. Klichévalget i Folketingssalen adskiller sig ikke signifikant fra klichévalget i hjemmesiderne, og klichéhyppigheden i Folketingssalen er tæt på et vægtet gennemsnit af klichéhyppigheden i hjemmesiderne.
Lige så let det er at bevise, at politikere har et overforbrug af klichéer, lige så svært er det at forklare hvorfor, for det er ikke rationelt. Hvorfor sige “vi har politik på alle hylder” i stedet for at udnytte taletiden til at fremlægge et politisk synspunkt? Politikernes vigtigste opgave er at vinde andre for deres synspunkter. Det kan ikke passe, at det gøres bedst med klichésnak.
Politisk korrekthed?
Så lige en flyvetanke til sidst. Politikerne bruger måske klichéer, fordi den politiske korrekthed kræver det. Kan klichéhyppighed være et mål for politisk korrekthed? I bekræftende fald har vi her beskrevet en objektiv metode til at måle denne størrelse.
Og så ultrakort til allersidst. Jeg har glemt at tage “politisk korrekt” med i klichélisten. Prøv selv.
Hans Degn, mag. scient.
[Hans Degn har skrevet en opfølgning her om mediernes modtagelse af undersøgelsen]
Nogle flere klicheer der også godt kunne have været med i undersøgelsen og måske ville have givet et anderledes samlet resultat:
Almene
“vurderer”, “jeg kan/må bare konstatere”, “jeg må bare sige”, “sende et signal”, “klædt på til”, “NN-effekten”, “få enderne til at mødes”, “i vadestedet”, “vise lederskab”, “røde tal”, “bundlinien”, “hen over midten”, “rød stue”, “blå stue” …
Manende
“politisk korrekt”, “sammenhængskraft”, “danskhed”, “integration”, “danske værdier”, “ghetto”, “kulturkristen”, “parallelsamfund”, “fast og fair”, “islamkritisk”, “aktivistisk udenrigspolitk”, “værdipolitik”, “demokrati”, “solidaritet” …
[opdateret 5. jan]
Spændende læsning! Tak for det!
Vedr. poitisk korrekthed: Jeg tror, politikerne benytter klicheerne i interwievs som fyld,så længe de har ordet kan andre ikke få det, eller stille spørgsmål! Tænk blot på politikere, der interwieves i TV!
Det er en dårlig undersøgelse!
Design spiller også ind, hvor mange ord og links er det lige at S har på hver side – og hvor mange har DF? Det skal jo med i statistiken.
DF bruger ikke klichéer fordi de ikke har indhold på deres side, det kan man jo se ..
Og iøvrigt hvis DF har lavet fejl i deres HTML kode, kan google heller ikke indeksere deres side ordentligt.
Dermed er det et spørgsmål om hvor søgeoptimerede og indholdsrige siderne er.
For at lave en undersøgelse skal I tage alle teksterne fra siderne, tælle antal ord anvendt i alt, finde antal klichéer anvendt i teksterne – og til sidst finde en procent ud fra det.
Godt nytår!
Mvh.
It-ingeniøren.
Artiklen diskuteres med dramatiske overskrifter i medierne:
Socialdemokraternes hjemmeside er 93% klicheer
http://www.180grader.dk/Politik/socialdemokraternes-hjemmeside-er-93-klicheer
S sprøjter klichéer ud
http://jp.dk/indland/indland_politik/article1935768.ece
Socialdemokratiske klicheer
http://www.bt.dk/debat/www.bt.dk/samfund/dansk-politik/socialdemokratiske-klicheer
Sprogforsker: Socialdemokrater bruger flest klichéer
http://www.dr.dk/Nyheder/Politik/2010/01/04/101243.htm
Socialdemokrater helt vilde med klicheer
http://www.berlingske.dk/kultur/socialdemokrater-helt-vilde-med-klicheer
Social Democrats wild with mats (en grotesk maskinoversættelse af dele af artiklen i 180 grader)
http://liberalisten.pointblog.net/Social-Democrats-completely-wild-with-mats.html
Kliché udtalelser fra politikerne
http://dindebat.dk/kultur-samfund/683249-kliche-udtalelser-fra-politikerne.html
S er den absolut største klichefabrik
http://www.bt.dk/politik/s-er-den-absolut-stoerste-klichefabrik
Dansk politik hjemsøgt af sproglige klicheer
http://www.kommunikationogsprog.dk/index.asp?nyhedsid=2437
Jeg er tilbøjelig til at mene, at definitionen af begrebet kliché er dybt værdiladet. Jeg mener f.eks., at borgerlige partier, ikke mindst DF, både på deres hjemmeside, i pressemeddelelser og i interviews i forskellige medier, herunder både trykte og i lyd og billeder, gør brug af en lang række klicheer, der emmer af nationalisme, etnocentrisme, lov og orden-retorik, som altsammen i denne artikel åbenbart ikke tæller som klicheer. Hvis man brugte et filter med dén slags vendinger, er jeg ikke i tvivl om, at DF ville være den store vinder.
Ifølge Sprogmuseet er en kliché “en sproglig vending, en metafor eller en eufemisme, der fra oprindeligt at være morsom eller forfriskende, er blevet triviel og pinlig ved gentagen brug.
MEN “samfundets svageste” er fandme ikke en klichee. Prøv at spørge dem selv. Måske et pinligt udtryk for den siddende regering; det er en anden sag.
Jeg vil gerne vide, hvorfor vendinger som ‘samfundets svageste’ og ‘udsatte familier’ er på listen og ikke ‘lavere skat’, ‘beskæftigelse’ og ‘markedskræfterne’ ikke er det?
Når man går ovenstående liste igennem finder man en blanding af sproglige vendinger samt udtryk som de førstnævnte, der mest åbenlyst mest benyttes af oppositionspolitikkere. Dette må vel være noget problematisk for undersøgelsens neutralitet?
Stor ståhej for ingenting! Hans Degn har bevist, at socialdemokrater bruger socialdemokratisk sprog, der beskriver socialdemokratiske mærkesager! Ikke andet! At Hans Degn kalder “økonomisk ansvarlighed”, “menneskesyn”, “bedre service” etc for klicheer fortæller kun noget om hans syn på verden.
@ole stig
Glem ikke DR: http://www.dr.dk/Nyheder/Politik/2010/01/04/101243.htm
Jeg havde godt nok ikke regnet at indlægget ville sprede sig så meget efter jeg delte det på 180grader.
@ Hans Henrik
Tak for hjælpen. Måske hjalp det også lidt til at vi lørdag udsendte en pressemeddelelse om artiklen.
[Charlotte Nielsens kommentar er flyttet til: Hvorfor der ikke findes klicheer
http://sprogmuseet.dk/sprogpsykologi/hvorfor-der-ikke-findes-klicheer/
OSA]
Et andet eksempel på samme fænomen – cirkelslutning og garanti for bekræftelse af fordomme: http://videnskab.dk/content/dk/teknologi/intelligent_software_afslorer_politisk_spin