Last modified on 14 November 2009, at 11:15

Expand reach within midsize and under-connected populations/sv

Sammanfattande problemställning: Wikimedia är inte fullt tillgängligt på valfritt språk världen runt

Lokala språk behövs för att uppnå global räckvidd

För att erbjuda "summan av all kunskap, till all människor", behöver Wikimedia erbjuda sitt innehåll på valfritt lokalt språk. Medan [pan-regional] språk såsom engelska, spanska, franska och portugisiska används av de flesta nuvarande internetanvändarna, så medför den fortsatta tillväxten av internetanvändande i världen, speciellt i sydliga regioner, att mer lokala språk kommer florera online. Wikimedia har för tillfället robusta Wikipedior i [pan-regional] språk, men med ökande möjligheter för internetanvändande av all människor så finns det ett ökande behov av robusta Wikimedia projekt på lokala språk.


Med 271 språkprojekt så erbjuder Wikipedia innehåll till 330 miljoner talande, eller ungefär 20% av världens online population.[1] Det finns för tillfället 12.5 miljoner artiklar och 2.47 miljoner "användbara" artiklar (>1.5kb vilket betyder ett minimum av 150-250 ord) på språk som talas av mer än 3 miljoner människor, hänvisandes till siffror från Juli 2009.[2] Men, mycket av denna lokalisering har skett i Europa. Ett stort antal människor i mellanöstern, Afrika, och södra Asien som inte talar [pan-regional] språk såsom engelska, franska, och portugisiska har begränsad tillgång till Wikimedia resurser på sitt inhemska språk. I dessa områden, finns det ungefär en miljard människor som talar arabiska, turkiska, persiska, indonesiska, vietnamesiska, thai, hausa, swahili, yoruba och amharic[3]. Av dessa så är 170 miljoner online idag, men med Forrester research förutsägelser om tillväxtsiffror om 10% till 20% per land och år för de kommande fem åren, så erbjuder dessa språk betydande möjligheter för Wikimedia[4].


[Advicory Board] medlemen Teemu Leinonen tror att utmaningen ligger i att utöka räckvidden och medverkan bland små språk där det inte finns någon historia av uppslagsverk och där koncepten är främmande. Han noterar att skandinaviska länder har en väldigt hög talande till artikelförfattande kvot, men att deras framgång ligger i att koncept såsom uppslagsverk är väl inbäddad i den skandinaviska kulturen. [5]


[Advicory Board] medlemmen Ethan Zuckerman tror att Wikipedias på mindre språk är ett yttrande av kulturell identitet. Därför behöver Wikipedior byggas från grunden och det är inte ett acceptabelt tillvägagångssätt att utöka dessa genom att översätta artiklar från engelska eller andra storspråks Wikipedior. Han tror att en av anledningarna till att Wikipedior på mindre språk i utvecklingsländer inte har byggts ut ännu beror på att personer som är online i dessa länder är ["fantastically over-committed – already building new industries, most desirable hires"] och därför har de inte tid att engagera sig i att bygga Wikipedia.[6]

Gemensamma utmaningar bland mindre Wikipedior

Det finns vissa utmaningar som delas av många små Wikipedior. Många av dessa problem är tekniska. För att människor på ett framgångsrikt vis skall kunna utveckla och underhålla en Wikipedia behöver de möjlighet att interagera med MediaWiki mjukvaran på deras eget språk. Men, trots den enorma kraft som laggts ner av media wiki teamet så är det fortfarande en lång väg kvar innan media wiki mjukvaran är fullständigt lokaliserad.[7] Ett annat problem för många mindre Wikipedior är en brist på verktyg och mallar för att underlätta redigering. Detta beror till stor del på en brist av redigerare som har den nödvändiga tekniska förmågan för att utveckla verktyg och ordna fel och buggar på wikin. Ett sista problem som är gemensamt för små Wikipedior med ett begränsat antal artikelförfattare och administratörer är svårigheten att underhålla siten genom att skydda den från spam och vandalism.

En erfaren artikelförfattare och administratör skriver om sin erfarenhet med att jobba på Wolof Wikipedian, ett språk som talas i västafrika. "När jag kom till wo.wp, så fanns det nästan ingen kategorisering, inga mallar, ingen informationsrutta, ingen sida som bybrunnen, osv. Jag är inte wolofspråkig, men jag kunde lösa alla dessa problem genom att arbeta paralellt med wolofspråkiga."[8]


Wikipedia är högst lokaliserat i Europa, men möjligheter finns fortfarande

Omfattande tillväxt har skett inom Europeiska medelstora språk Wikipedior. Artikeltillväxt i nationella Europeiska språk så som tjeckiska, litauiska och ungerska, såväl som mer etablerade danska och norska språk har varit 25% eller mer det senaste året med tvåsiffrig artikelförfattartillväxt för de mindre etablerade Wikipediorna. Likaså, tillväxten hos ett fåtal lokala språk så som catalan i Spanien har varit markant. På catalan finns ungefär 190,000 artiklar med över 65,000 som är större än 15.kb.[9] Tillväxten i de medelstora språk Wikipediorna kopplat till det fortsatta användandet av många Européer av [pan-regional] språk Wikipedior (engelska, franska, spanska, ryska, portugisiska) har lett till ett genomslag på 32% bland medelstora Europeiska länder (det vill säga, inte inkluderat Storbritannien, Frankrike, Tyskland, Ryssland, Spanien), en av de största genomslagen av Wikipedia globalt[10].


Men, möjligheter för ytterligare lokalisering finns fortfarande i Europa. Med 64% av Västeuropéerna och 29% Östeuropéerna användandes internet, eller ungefär 500 miljoner människor, så finns det fortfarande en möjlighet att ytterligare slå igenom i Europa, liksom att leverera innehåll på valfritt Europeiskt språk. Eftersom de flesta Europeiska länder domineras av ett enda nationellt språk som är vitt talat, använt i media, och i utbildning, så kan det vara nödvändigt att erbjuda robusta Wikimedia projekt i lokala språk både för att attrahera och behålla lojala medarbetare som vill dela summan av all kunskap. Språk med 3 till 20 miljoner talande och färre än 50,000 lokala språk Wikipedia artiklar inkluderar språk så som grekiska, albanska och vitryska.[11]


Wikipedia har möjligheten att utöka räckvidden i mellan östern med Araber

Medelstora språk Wikipedia tillväxt, även i nationella språk, har inte florerat överallt. I mellanöstern och Nordafrika[12], finns det 571 miljoner talande av fem stora språk (arabiska, turkiska, persiska, kurdiska, hebreiska) med ungefär 74 miljoner som har internet tillgängligt. De turkiska och hebreiska språkens Wikipedior har över 40,000 "användbara" artiklar, vilket representerar mellan 35% och 45% av det totala antalet artiklar på dessa språk. Men, arabiska, med 467 miljoner talande och ungefär 49 miljoner internetanvändare har mindre än 19,000 "användbara" artiklar större än 1.5kb. Det har förekommit en ökning i tillväxten av artikelförfattare från 11% maj 2007-maj 2008 till 38% maj 2008-maj 2009.[13]

De turkiska, persiska, hebreiska och arabiska språken är alla använda för instruktioner på elementär-, sekundär- och universitetsutbildning nivå. [This means that the is literate in the local an important factor in developing a Wikipedia]. Men, i många arabspråkiga länder utförs utbildning på elituniversitet på engelska och utbildade arabspråkiga verkar föredra att bidra till den engelska Wikipedian[14]. Dessutom så finns det ytterligare tekniska svårigheter såsom svårigheter med att skriva arabaiska på vissa tangentbord[15] och metawikis oförmåga att stödja vänster till höger skrift.

Möjligheter finns att fortsätta lokalisera sig i sydöstra Asien

Det finns över 470 miljoner talande 7 omfattande sydostasiatiska språk (indonesisk tagalog/ filipinsk vietnamesiska, thai, malajiska, burmesiska och khmer) omfattandes 80% av invånarna i Indonesien, Filipinerna, Vietnam, Thailand, Malaysia, Myanmar, Cambodia, Lao, Singapore och Östtimor) Dessa språk har alla officiell status i ett eller flera länder och används omfattande i lokala skrivna medier. Internetåtkomst varierar dramatiskt från land till land. Malaysia och Singapore har båda hög internetanvändning på respektive 63% och 69% av invånarantalet. Vietnam, Thailand och Indonesien har medelmåttig internetanvänding mellan 11-21% av invånarantalet och cambodia, Myanmar, Lao och Östtimor har alla internettanvänding av mindre än 2% av invånarantalet[16].

Tillväxten av de sydostasiatiska språkens Wikipedior har berott på två faktorer, antalet talande med internetåtkomst, och mängden engelskspråkigt läskunniga. Större antal potentialla användare och lägre antal engelskspråkigt läskunniga är korrelerade med större utbyggnad av Wikipedior. Till exempel, indonesiska, vietnamesiska och that Wikipediorna har respektive ungefär 108,000 93,000 och 48,000 artiklar med 22,000 28,000 och 17,000 artiklar som är större än 1.5kb. I länder där dessa språk talas, Indonesien, Vietnam och Thailand så är dessa nationella språk i stort sett de språk som används för utbildning även på universitetsnivå. Detta står i kontrast till Malay och Tagalog/Filipinska, språk som talas i länder med stor engelsk läskunnighet som beror på det utbredda engelska användandet i utbildningssystemet. Malay Wikipedian har 44,000 artiklar utav vilka 11,000 är större än 1.5kb medan Tagalog/Filipinska har 22,000 artiklar med bara 2,000 som är större än 1.5kb. givet den begränsade internetåtkomsten i Cambodia och Myanmar så är det inte förvånande att de Khmeriska och Burmesiska Wikipediorna respektive har endast 2,000 och 1,000 artiklar.[17]


Wikipedia är underlokaliserat i subsahariska Afrika

Det finns över 230 miljoner som talar ett av 12 stora subsahariska afrikanska språk, omfattandes 28% av invånarantalet. Men många av Wikipediorna på dessa språk har visat minimal tillväxt. För att datera endast tre Wikipedior, swahili, yoruba och afrikaans har mer än 5000 artiklar. Det finns 13 Wikipedior med subsaharisk afrikanska språk med mer än 3 miljoner talande som har mindre än 500 artiklar och dessa inkluderar omfattande språk så som Hausa och Zulu vilka talas av mer än 20 miljoner människor var.[18] Det finns ett flertal hinder som har bidragit till långsam tillväxt av Afrikansk språkliga Wikipedior. Först och främst den begränsade internetåtkomsten i subsahariska Afrika eftersom endast 4% av populationen är internetanvändare.[19] Men åtkomst av internet ökar i snabb takt, mobiltelefonen har slagit igenom betydligt mer än internet och vissa länder har byggt 3G nätverk som ger människor möjlighet att komma åt internet via sina telefoner[20]. Många Afrikanska språk har endast existerat i skriven form under en kort period och är inte det primära språket för komunikation bland de välutbildade. Detta har skapat en annan barriär för tillväxten av subsahariska Afrikanska Wikipedior eftersom många afrikaner som använder Wikipedia gör detta på de tidigare koloniala språken franska, engelska och portugisiska.


[NOTE: While principally anecdotal and supported by only a single days worth of page views, it is still worthwhile noting that articles in many of these local languages, Swahili in particular, have been "seeded" by editors and organizations (e.g. Google) outside of Africa showing a lack of participation from within country].

Leverera Wikipedia offline

Medans lokala språk ger möjlighet för större genomslagskraft i onlinevärlden så representerar offlinevärlden 5 miljarder människor vilket är en mycket större möjlig målgrupp för Wikimedia. Med majoriteten av den underuppkopplade eller ickeuppkopplade världen liggandes i länder i den sydliga regionen, så kan Wikipediaversioner i de mest talade lokala språken möjliggöra Wikimedias fortsatta mission att tillåta "alla människor" att "dela summan av all kunskap".

Idag så har offline Wikipediaprojekt skapats för en mångfald av olika anledningar från bekvämlighet till [fundraising], till utbildningsverktyg i Storbritanniska skolor, såväl som för att utöka räckvidden i världen. Dessa offlineprojeket har varit begränsade till engelska, spanska, portugisiska, tyska och ett fåtal andra europeiska språk. Projekten har varit relativt små i omfattning med olika mål och strategier. Att nå människor med begränsad tillgång har endast varit fokus i väldigt få projekt och medans dessa projekt, så som One Laptop per Child, har haft en inverkan på hundratusentals, så har inget nått den framgång som online Wikipedior. Alla har dessutom tagit upp betydande tid och resurser i jämförelse med online Wikipedior.

Men är offline Wikipedior nödvändiga? Många Wikipediamedlemmar frågar sig om offline projekt utan redigeringsmöjligheter, även de som fokuserar sig på att utöka räckvidden till dem med begränsad tillgång, verkligen är i linje med missionen att alla medverkar och delar kunskap. [Likewise, there are increasingly creating phone-based applications (including voice only) to provide access via call centers in developing countries [21]].


En sammanfattning av offlineprojekthistorik och potentiella tillvägagångssät kan hittas på Offline Wikimedia projects

Task Forces

Arabiska Task Force

Över 20% av Arabspråkiga har tillgång till internet, vilket betyder ungefär 100 miljoner användare. Arabiska är också det språk som används i media, utbildning och handel i många länder i mellanöstern och Nordafrika. Men det finns relativt få "användbara" artiklar (artiklar större än 1.5kb) på den arabiska Wikipedian som möter detta behov. Det finns en kärngrupp på 5+ artikelförfattare som har växt, men deras uppgift är svår. Med spridning av talande över många länder och inget [chapter] så är artikelförfattargemenskapen svårutvecklad. Dessutom så finns det stora tekniska svårigheter att övervinna. Det mest markanta problemet är meta wikis oförmåga att stödja vänster- till högerskrift.[22]

Medans den fortsatta tillväxten av de turkiska, hebreiska, persiska och kurdiska språkens Wikipedior är eftertraktade, så kan tillväxten hos den arabiska Wikipedian bidra till den största möjligheten för djupare genomträngning i mellanöstern och Nordafrika. Att utveckla en tillväxtplan för den arabspråkiga Wikipedian som tar både teknologiska begränsningar och expansion av antalet artikelförfattare i bektning är en prioritet. I fas II kommer en "task force" att skapas för att ytterligare undersöka möjligheter och utmaningar för tillväxt i mellanöstern/Nordafrika, speciellt med arabspråkiga.


Se Arabic Task Force för listan med kritiska frågor som är associerade med denna "task force", [as well as specific supporting materials].

Lokala språk Task Force

Det finns 79 språk med över 10 miljoner som har detta som modersmål, vilket representerar 4.7 miljarder människor och en miljard onlineanvändare.[23] Wikimedia har haft goda framgångar med att lokalisera Wikipedia i många av dessa nationella och höganvända lokala språk i Europa, liksom med vissa språk i mellanöstern, nämligen hebreiska och turkiska med över 40,000 "användbara" artiklar större än 1.5kb var, så även i Sydostasien med indonesiska och vietnamesiska med över 25,000 innehållsrika artiklar var.[24] Men möjligheten finns fortfarande att ytterligare lokalisera Wikimedias projekt.

Toppspråk definierade genom antal som har språket som modersmål, allmän förekomst i daglig och online användning, och låglokalisering av Wikipedia är:

Sydöstra Asien[25]

  • Malajiska, Malaysia med 26 miljoner onlineanvändare och 45,000 artiklar (11,000 "användbara")
  • Thai, Thailand med 12 miljoner onlineanvändare och 49,000 artiklar (18,000 "användbara")
  • Tagalog/Filipino, Filipinerna med 5.4 miljoner onlineanvändare och 23,000 artiklar (2,500 "användbara") (NB: Forrester Research förutsäger att internetanvändandet kommer öka med 20% årligen i Filipinerna de närmsta fem åren)

Europeiska[26]

  • Grekiska, Grekland med 4.3 miljoner onlineanvändare och 45,000 artiklar (17,000 "användbara")
  • Vitryska, Vitryssland med 2.5 miljoner onlineanvändare och 17,000 artiklar (2,300 "användbara")
  • Albanska, Albanien med .87 miljoner onlineanvändare och 24,000 artiklar (3,800 "användbara")

Mellanöstern[27]

  • Persiska, Iran med 9.7 miljoner onlineanvändare och 66,000 artiklar (12,000 "användbara")
  • Kurdiska, Irak med 3.5 miljoner onlineanvändare och 13,000 artiklar (1,000 "användbara")

Subsahariska Afrika[28]

  • Hausa, Nigeria med 1.6 miljoner onlineanvändare och 131 artiklar (35 "användbara")
  • Swahili, Tanzania med 1.2 miljoner onlineanvändare och 12,500 artiklar (1,200 "användbara")


Att förstå kriterier, förutsättningar och resurser som behövs och som gjorde andra lokala språkprojekt lyckade även i närvaro av hög [pan-regional] språkanvändning (e.g Europa) kan ge en uppsättning gemensamma verktyg och strategier som möjliggör fortsatt lokaliseringsframgångar med de språk som nämns ovan. I fas II kommer en "task force" skapas för att ytterliggare undersöka möjligheter och utmaningar för ökad lokalisering med fokus på de största underrepresenterade lokala språken.


Se Local Language Task Force för listan med frågor som är associerade med denna "task force", [as well as specific supporting materials].

Offline Task Force

Med över en miljard, och fortfarande ökande, människor online, så är möjligheten för Wikimedia att fortsätta med sina onlineprojekt betydande. Men det finns 5 miljarder människor för vilka internetåtkoms antingen är svår eller ickeexisterande. Om Wikimedia verkligen skall nå sitt mål att dela kunskap med all människor, behöver offlineprojekt spela en större roll?

Att förstå [the potential mission-alignment], syfte och möjligheter, såväl som potentiella utmaningar, och resurser som behövs för att utöka räckvidden genom offline Wikipediaprojekt är en nyckel för att definiera tillvägagångssättet för offlineprojekt. I fas II kommer en "task force" att skapas som ytterligare kommer utforska möjligheter och utmaningar för utökad lokalisering med fokus på de mest underrepresenterade lokala språken.

Se Offline Task Force för en lista med kritiska frågor associerade med denna "task force", [as well as specific supporting materials].


Ytterligare information och resurser

References

  1. Wikimedia penetration
  2. Analysis based on information from Wikipedia stats and http://www.ethnologue.com/
  3. Reach/Regional_Analysis
  4. Forrester Research, Global Online Population Forecast, 2008 to 2013,Global Online Population Forecast 2008-2013/
  5. Teemu Leinonen
  6. Ethan Zuckerman
  7. For more information on localization efforts seehttp://www.mediawiki.org/wiki/Localisation
  8. Talk:Reach/Regional Analysis/Sub-Saharan Africa
  9. Europe
  10. This estimate was derived from data from the International Telecommunications Union and ComScore
  11. Reach/Regional_Analysis/Europe
  12. Note that while Turkey is a European country in order to be consistent with the analysis of unique users performed by ComScore we have placed it in the Middle East and North Africa ComScore data on Wikimedia
  13. Reach/Regional_Analysis/Middle_East_&_North_Africa
  14. http://bits.blogs.nytimes.com/2008/07/19/a-wikipedian-challenge-convincing-arabic-speakers-to-write-in-arabic/
  15. http://bits.blogs.nytimes.com/2008/07/19/a-wikipedian-challenge-convincing-arabic-speakers-to-write-in-arabic/
  16. Information on Internet use from International Telecommunications Union 2008 /
  17. Reach/Regional Analysis/South-East Asia
  18. Reach/Regional Analysis/Sub-Saharan Africa
  19. Information on Internet use from International Telecommunications Union 2008 /
  20. http://www.nytimes.com/2009/10/06/science/06uganda.html?_r=2&hpw
  21. New York Times article, Question Box Answers Calls in Africa,| Question Box Answers Calls in Africa/
  22. Reach/Regional_Analysis/Middle_East_&_North_Africa
  23. information from the [International Telecommunication Union and http://www.ethnologue.com/]
  24. Southeast Asia Middle East
  25. Southeast Asia
  26. Europe
  27. Middle East
  28. Sub-Saharan Africa