Detección de idioma

El modelo de detección de idioma identifica el lenguaje natural en el que se encuentra el texto introducido.

Por ejemplo, la detección de idioma puede ayudar a que las interacciones de soporte al cliente sean más personalizadas y rápidas. Los bots conversacionales del servicio de atención al cliente pueden interactuar con los clientes en función del idioma del texto introducido y responder de la manera adecuada. Si un cliente necesita ayuda con un producto, el servidor de bots conversacionales puede mostrar el manual del producto de idioma correspondiente, o bien transferirlo al centro de llamadas para el idioma específico.

Idiomas soportados

Código de Idioma Lenguaje
af Afrikaans
sq Albano
am amárico
ar árabe
hy Armenio
as asamés
az Azerbaiyano
ba Bashkir
eu Vasco
be belgas
bn bengalí
ber bereber
bs bosnio
bg Búlgaro
my birmano
ca catalán
ceb Cebuano
km Jemer Central
ce checheno
zh-CN Chino (Simplificado)
zh-TW Chino (Tradicional)
cv Chuvash
co corso
hr Croata
cs checo
da danés
dv Divehi
nl holandés
mhr Mari Oriental
en Inglés
eo esperanto
et estonio
fi Finés
fr francés
gl Gallego
ka Georgiano
de Alemán
el griego
gu Gujarati
ht haitiano
ha hausa
he Hebreo
hi Hindi
hu Húngaro
is islandés
io ido
ig Ibo
ilo ilocano
id indonesio
ga irlandés
it Italiano
ja japonés
jv javanés
kab cabila
kn Canarés
kk Kazajo
ky Kirguís / Kirguizo
ko coreano
ku Curdo
lo Laosiano
la Latín
lv letón
lt lituano
jbo lojban
lb luxemburgués
mk Macedonia
mg malgache
ms malayo
ml malabar
mt maltés
mr marathi
mn Mongol
ne nepalí
no Noruego (Bokmal)
nn Noruego (Nynorsk)
or oriya
fa Punjabi/Panjabi
pl persa
pt polaco
pa portugués
ps Pasto
qu quechua
ro Rumano
ru ruso
sr Serbio
sd sindhi
si Cingalés
sk eslovaco
sl Esloveno
so Somalia
es español
su sudanés
sw Swahili
sv sueco
tl Tagalo
tg Tajik
ta Tamil
tt tatar
te Telugu
th Tailandia
bo tibetano
tr Turquía
tk turcomano
ug Uiguro
uk Ucrania
ur Urdu
uz Uzbeco
vi Vietnamita
war Waray
cy galés
fy Frisio del Oeste
sah yacut
yi Yídish
yo yoruba

Ejemplos

Texto de Entrada Idioma y puntuaciones
OCI recently added new services to the existing 
compliance program including SOC, HIPAA, and ISO, to enable 
our customers to solve their use cases. We also released new 
white papers and guidance documents related to Object Storage, 
the Asteroid Prudential Regulation Authority (APRA), and 
the Central Bank of Bankland. These resources help regulated 
customers better understand how OCI supports their regional 
and industry-specific compliance requirements. Not only are 
we expanding our number of compliance offerings and regulatory 
alignments, we continue to add regions and services at 
a faster rate.
English 0.9999
«Нос» - сатирический рассказ Николая
Гоголя, написанный во время его жизни в
Санкт-Петербурге. В это время в
творчестве Гоголя основное внимание
уделялось сюрреализму и гротеску с
романтическим оттенком; Предлагаемый
здесь рассказ «Нос» является примером.
Рассказ Николая Гоголя «Нос» был
написан между 1832 и 1833 годами и
завершен в 1834 году, подвергался
различным пересмотрам и модификациям
Н. Гоголем, в основном из-занепрерывного вмешательства цензуры.
Russian 0.9999

El JSON del primer ejemplo es:

Solicitud de ejemplo
POST https://<region-url>/20210101/actions/batchDetectDominantLanguage
Formato de solicitud de API:
{
  "documents": [
    {
      "key": "doc1",
      "text": "OCI recently added new services to existing compliance program 
including SOC, HIPAA, and ISO to enable our customers to solve their use 
cases. We also released new white papers and guidance documents related to 
Object Storage, the Asteroid Prudential Regulation Authority (APRA), and the 
Central Bank of Bankland. These resources help regulated customers better 
understand how OCI supports their regional and industry-specific compliance 
requirements. Not only are we expanding our number of compliance offerings and 
regulatory alignments, we continue to add regions and services at a faster clip."
    }
  ]
}
JSON de respuesta:
{
    "documents": [
        {
            "key": "1",
            "languages": [
                {
                    "code": "en",
                    "name": "English",
                    "score": 0.9999840921009815
                }
            ]
        }
    ],
    "errors": []
}

Limitaciones

  • Solo se devuelve un idioma. En los casos en que la entrada es multilingüe, se devuelve el idioma dominante.