Tecnología

Inicio

Cómo detectar un carácter CJK en Java

Cómo detectar un carácter CJK en Java


La detección de un carácter chino, japonés y coreano, o CJK, en Java es fácil con el uso de ciertas clases de Java, como InputStreamReader y OutputStreamWriter. Estas dos clases se traducen en y fuera de Unicode de codificaciones locales, incluyendo Big5 y GB2312 codificaciones. idiomas chino, japonés y coreano son todos de Asia Oriental y que están clasificados como de doble byte conjuntos de caracteres, o DBCS, lenguas, lo que significa que cada uno de estos idiomas requerirá una gran cantidad de bits para representar sus caracteres de doble byte.

Instrucciones

1 Abrir la cadena de código Java que se le validando para la presencia de caracteres CJK. Asegúrese de que ha cargado las clases de Java necesarios para la aplicación Java. Utilice la aplicación Java Swing para asegurarse de que tiene instaladas estas clases.

2 Utilice el siguiente código en su cadena de Java para hacerlo volver cierto si la cadena "s" contiene los caracteres chinos:

containsChinese booleanos públicas (String s) {

for (int i = 0; i <s.length (); i ++) {

if (isJapanese(s.charAt(i)) {

return true;

}

}

falso retorno;

}

3 Inserte el siguiente código en su serie Java para que sea devuelve verdadero si el char "c" es un carácter de doble byte:

isJapanese booleanos públicas (char c) {

si (c && c> = '\ U0100' <= '\ uffff') return true;

falso retorno;

// Más simple: el retorno c> '\ u00ff';

}

4 Utilice el siguiente código para hacer su solicitud de restitución cierto si la cadena "s" contiene caracteres de doble byte o CJC:

containsDoubleByte pública booleano (s String) {

for (int i = 0; i <s.length (); i ++) {

if (isDoubleByte(s.charAt(i)) {

return true;

}

}

falso retorno;

}

Consejos y advertencias

  • Hay muchos tutoriales para aplicaciones Java que puede probar de forma gratuita. Unirse a varios foros de discusión para buscar consejo y orientación de los usuarios de Java experimentados.
  • Para mostrar los caracteres de su idioma de destino correctamente, asegúrese de que su navegador tiene las fuentes necesarias para ello. Su navegador debe ser compatible con HTML 4.0 y apoyar Plano Multilingüe Básico, que es el estándar de juego de caracteres de 16 bits que reconoce la mayoría de los idiomas que se utilizan activamente en el mundo.