国际化语种名称的标识


国内因为版号的问题,导致很多游戏厂商选择出海。在国际化的市场要想取得好的成绩,就必须要做好深度的本地化,其中最基础的一块就是语言。

为了给用户提供更好的游戏体验,通常用户第一次进游戏的时候,会根据用户当前设备设置里所选择的语言来设置游戏的默认语言。

通常系统返回的是  语言-国家/地区标识,如 ja-jp,日语-日本。en-us,英文-美国。当然还有比如 en-CA,英文-加拿大。每一个语言都可能对应很多国家/地区,一个国家/地区也可能有很多种语言。比如香港,可能用繁体中文 zh-HK/zh-Hant-HK 或者 en-HK。这就让情况变得比较复杂了,所以我们需要先了解相应的规范。

根据RFC 4646的规范,语言的标签表示法

A Language-Tag consists of:
                   langtag                ; generated tag
              -or- private-use            ; a private use tag
              -or- grandfathered          ; grandfathered registrations

langtag       = (language
                 ["-" script]
                 ["-" region]
                 *("-" variant)
                 *("-" extension)
                 ["-" privateuse])

language      = "en", "ale", or a registered value  ;shortest ISO 639 code 

script        = "Latn", "Cyrl", "Hant" ; ISO 15924 code

region        = "US", "CS", "FR" ISO 3166 codes
                "419", "019",  or UN M.49 codes
                 ;ISO 3166 code

variant       = "rozaj", "nedis", "1996", multiple subtags can be used in a tag

extension     = single letter followed by additional subtags; more than one extension
                may be used in a language tag

private-use   = "x-" followed by additional subtags, as many as are required
                Note that these can start a tag or appear at the end (but not
                in the middle)

grandfathered = tags listed in the old registry that are not otherwise redundant (a closed list)

分为 language["-" script]["-" region]*("-" variant)*("-" extension)["-" privateuse] 六个部分。

在安卓和iOS上返回的通常只用到前三项(如果语言没有变种,则略过script项,返回类似 en-US 这种,其中 US 为美国),分别是 language – ISO 639,script – ISO 15924, region – ISO 3166。

其中地区 region 全大写(如中国CN,美国US),language 全小与(如中文zh,英文en), script 是首字母大写(语言的变种,如中文分:简体中文与繁体中文)。

示例:zh-Hant-HK  中文 - 繁体中文 - 香港地区。

language 由 ISO 639 规范进行定义的,将不同语种的名称分为二个字母的简称和三个字母的简称,这里使用最短的(二个字母)的简称,比如简体中文/繁体中文都使用zh表示。

详情可查看维基百科>>

ISO 51924 列表>>  简体中文就是 Hans 繁体中文就是 Hant

最后一个是地区 region,它在  ISO 3166 规范 中定义过了,这里使用二位字母表示。CN 表示中国、TW表示台湾、US 表示美国、HK 表示香港,全部为大写。

到这里基本上理清楚了,当我们看到

zh-Hant-MO 时就知道是繁体中文 - 澳门地区。

更多的示例如下:

zh-Hans 简体中文
zh-Hans-CN 大陆地区使用的简体中文
zh-Hans-HK 香港地区使用的简体中文
zh-Hans-MO 澳门使用的简体中文
zh-Hans-SG 新加坡使用的简体中文
zh-Hans-TW 台湾使用的简体中文


zh-Hant 繁体中文
zh-Hant-CN 大陆地区使用的繁体中文
zh-Hant-HK 香港地区使用的繁体中文
zh-Hant-MO 澳门使用的繁体中文
zh-Hant-SG 新加坡使用的繁体中文
zh-Hant-TW 台湾使用的繁体中文

对应获取设备当前语种标识的代码。

安卓(注意 getScript 方法需要 API 21+才支持):

Locale locale;

if (Build.VERSION.SDK_INT >= 24) {
locale = LocaleList.getDefault().get(0);
} else {
locale = Locale.getDefault();
}

String strLanguageIden = locale.getLanguage() + "-" + locale.getScript() + "-" + locale.getCountry();

iOS代码

NSString *pfLanguage = [NSLocale preferredLanguages][0];

preferredLanguage : zh-Hant-HK

如果只选英文,不选英文(国家/地区)它会将下面的地区带上。

preferredLanguage : en-CN  (这里的CN就是上面截图中的地区-中国这一栏)

如果选择 English(Canada)加拿大地区,则会输出 en-CA

preferredLanguage : en-CA

根据以上特征,我们只需要区分第一位是什么。特别要注意的是我们只区分简体与繁体中文,其它语言如果我们需要区分变体,可内嵌判断。

if (strLanguageIden.indexOf("zh-") > -1) {
// 中文
if (strLanguageIden.indexOf("zh-CN") > -1 || strLanguageIden.indexOf("zh-Hans") > -1) {
// 简体中文
strLanguage = "cn";
} else {
// 繁体中文
strLanguage = "tw";
}
} else if (strLanguageIden.indexOf("en-") > -1) {
// 英语
strLanguage = "en";
} else if (strLanguageIden.indexOf("ja-") > -1) {
// 日语
strLanguage = "jp";
} else if (strLanguageIden.indexOf("ko-") > -1) {
// 韩语
strLanguage = "kr";
} else if (strLanguageIden.indexOf("fr-") > -1) {
// 法语
strLanguage = "fr";
} else if (strLanguageIden.indexOf("de") > -1) {
// 德语
strLanguage = "ge";
} else if (strLanguageIden.indexOf("vi-") > -1) {
// 越南文
strLanguage = "vn";
} else if (strLanguageIden.indexOf("th-") > -1) {
// 泰文
strLanguage = "th";
} else {
// 默认英语
strLanguage = "en";
}

  我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=2r9474qams6c0