IDN-TLDer, Internetionella tecken i toppdomänadresser på Internet

Vi i Sverige ser ofta våra dagliga beteenden som det självklara och att alla som inte gör som oss, bara inte har lärt sig..- ”men det kommer väl”.
..och om ingen annan gör det så kan ju vi lära dem..

Vi lever i vår lilla bubbla av trygghet och allt fungerar ju bra..

Men vår vardag är inte speciellt kompatibel med de människor som bor utanför Sverige, utanför Skandinavien, eller utanför Europa osv.
Inte i det verkliga livet och inte på Internet.

Men det här inlägget ska inte handla om omvärldspolitik eller ”verklighetsvärldens” vardagliga djävligheter, utan något så simpelt som datautrustning, Internetanvändning och domänadresser.

Jag fick idén till inlägget för ett par dagar sedan när @cleas svarade med ordval som hittepå-tld:er på min Tweet om att McDonalds registrerat [макдональдс.рф] (som jag rekommenderar dig att besöka)
http://idnblog.com/2011/02/24/mcdonalds-missed-mcdonalds-com/

No offense till @cleas eller någon motsatsreaktion i övrigt kring det (men jag är inte alls lika rädd för IDN-TLDer som jag är för nya gTLDer), utan jag tänkte mer skriva och förklara lite om den nya generationen av IDN-domäner och IDN-TLDer.

Jag kommer att försöka lägga mig på en hyfsat ”lättsmält” nivå, eftersom de allra flesta inte ens förstår att förkortningen IDN står för Internationalized domain name (eller på Svenska fritt översatt ”Domäner med internationella tecken).

IDN innefattar egentligen alla tecken som inte är a-z, 0-9 och ”-” (bindestreck), (endast 37 tecken) vilket gör våra egna ”Svenska tecken” å,ä och ö till IDN.
Men under den Svenska toppdomänen .se, så tilläts dessa i domännamn (å,ä och ö) redan 2003, tillsammans med é och ü. (alltså 42 tecken).

Några år senare (sommaren 2007) så tilläts sedan samtliga tecken som förekommer i alla de Nordiska språken, tillsammans med alla tecken ur de officiella minoritetsspråken;
finska, meänkieli, samiska, romani och jiddish. (+88 tecken)

Det gör att det idag erbjuds 130 registreringsbara tecken unden .se (..och under 2011 kan det komma att bli ännu fler).

Vilka alla dessa tecken är kan du se på http://www.iis.se/docs/teckentabell-03.pdf

Men det är bara under .se, flera andra toppdomäner erbjuder både färre och flera och vissa inga IDN-tecken alls.

Men vad är bra och vad är dåligt då?

Ja tittar man på Arpanet och framåt till det Internet vi känner idag, så har det sedan mitten av 90-talet arbets för att fler tecken ska kunna implementeras i adresser på Internet.
Varför det då? Vi klarar oss ju! – även om vi kanske inte använder å,ä och ö så ofta..

Jo, det har ju med vilka språk människor talar och använder och även om jag håller med @cleas i mångt och mycket, så vill jag påstå att vårt Svenska användande främst kan jämföras med det amerikanska och europeiska användandet (i viss mån).

Kikar vi på språkanvändandet så är våra tangentbord inte ens homogena i Europa och teckentabellmässigt så skiljer sig våra tangentbord mycket även inom Europa.
Även om vårt egna (SV/FI) qwerty-tangentbord med å,ä och ö är väldigt lika de engelska, så har vi Bulgariska och Grekiska som använder olika typer av kyrylliska, eller om vi bara tittar på den här ganska talande bilden så ser vi att våra tangentbord vi använder erbjuder olika typer av tecken
http://en.wikipedia.org/wiki/File:Latin_keyboard_layouts_by_country_in_Europe_map.PNG

Det gör också att vi har olika förutsättningar att ens lyckas få fram olika tecken och på sammam sätt är det omvända. Alltså sitter du med ett Kinesiskt, Indiskt eller Japanskt tangentbord, så kan det varar en jobbig bedrift att ens kunna skriva in en URL med latisnska tecken.

Och IDN-domäner har ju funnits och erbjudits sedan början av 2000-talet..och jo det är sant att vissa gTLDer och andra ccTLDer erbjudit IDN-domäner som domännamn.

Problemet har däremot varit att det endast erbjudits på domännamnsnivån [domännamn.tld] = [IDN.Latin] det har alltså handlat om hybrider eller mixat IDN, medan toppdomänen fortfarande varit med latinska tecken (”icke-IDN).
Det som ICANN införde i slutet av 2009 och som fick namnet ”fast track” var att erbjuda de befintliga toppdomänerna som alltså redan hade en egen landsdomän att ansöka om att få den med sina egna tecken, på sitt eget språk – alltså så att ett domännamn kan skrivas [IDN.IDN].

Idag finns det 28 aktiva IDN-toppdomäner som är aktiva och i bruk (bla 2 st Kinesiska varianter, 7 olika Indiska, Rysk, Egyptisk, Thailändsk osv)
Du kan se hela listan här
Det finns även 9 stycken föreslagna, som exempelvis Bulgariska och Serbiska, se listan här

Det som är extremt utmanande och svårt är att många av dessa teckentabeller skrivs från höger till vänster istället för vänster till höger.

Och det är ju en sak att det fungerar att skriva in i ett adressfält, men Internet är ju lite mer än så..
Det är här IDNA (IDN for applications) kommer in. ICANN wikisidan http://wp.nu/at4b och se hur jag menar och besök sedan den här Googlesidan och observera här hur Google (som vi Svenskar ju kan så bra..) skiljer sig på flera sätt från hur vi är vana att använda Google:

– Pröva att skriva in något brevid den sökfrasen som redan står – du kommer att märka att du förpassas längst till vänster.
– Som ni ser är samtliga av dessa resultat URL:er med latinska tecken (de gröna länkarna), men här indexerar Google HELT utifrån Titlar och texter – Detta skiljer sig alltså från det sätt vi Svenskar är förunnade att även dra nytta av domännamnet.
http://wp.nu/at4d

Kika sedan på de olika arabiska tangentborden det ryska det japanska eller för den delen traditionell kinesiska.

Tänk sedan i termer som att att vi numera är över 2 miljarder Internetanvändare och du kan se fördelningen från juni 2010 här

Min uppfattning: IDN-TLDer (ccTLDer på eget språk) är betydligt mer naturligt än många av de kommande gTLDerna, som förväntas godkännas i nästa månad (13-18 Mars) under ICANN-mötet i San Francisco.
Vilken boll som då sätts i rullning och vad det kommer att göra MOT det Internet vi känner idag vet ingen.

Och även om jag riskerar att ses som en foliehatt, så förutspår jag att de problem vi upplever idag kring domäner, oetisk SEO, phishing försök och attacker kommer att..
nej, jag hade tänkt att skriva mångdubblas, men jag tar tillbaka det och förutsår att de mångdubbls i kubik.

Och det största förändring i vårt beteende, alltså vanliga Internetanvändares beteenden kommer från de som annars varit mest aktiva att skydda sina revir, dvs de större Varumärkesinnehavarna.
Varför?

Jo för allteftersom företag som Microsoft kommer att lägga allt sitt content under .microsoft eller .msft eller liknande och Samsung lägger sitt under .samsung eller motsvarande förkortning så kommer vi att acceptera och surfa till och chansa och skriva in vad vi tror är den riktiga TLDn

Om en månad får vi se. vad som sätts i rullning, tills dess kan du läsa lite om vad jag skrivit om de nya gTLDerna och mina farhågor (Börja nerifrån)

Läs mer här

Följ Internet Sweden på Twitter!
Följ Internet Sweden på Facebook!

Related Articles

1 Comment

Avarage Rating:
  • 0 / 10

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *