Tecnología

Inicio

Acerca de Web Mining

Cada día, millones de usuarios buscar en la Web, utilizando los motores de búsqueda de confianza, como Google y Yahoo !. Para la mayoría de la gente, los resultados de búsqueda de los motores de búsqueda populares proporcionan vínculos a información útil que responde a sus preguntas. Las necesidades de información de las grandes empresas, académicos, el gobierno y los investigadores profesionales va mucho más allá de la capacidad de los motores de búsqueda comunes. Extraen Internet de datos en lugar de enlaces a páginas web. Encontrar a estos datos y la puesta en funcionamiento es esencial para mejorar los servicios y mantener la competitividad.

Caracteristicas

La minería de datos recupera la información deseada mediante la búsqueda de patrones, texto y asociaciones para analizar la información oculta en la Web invisible que incluso los motores de búsqueda no han indexado. Estos datos se procesan a continuación en bases de datos, hojas de cálculo y software especial para proporcionar informes basados ​​en las necesidades de los mineros.

tipos

actividades de minería de datos se dividen en tres áreas distintas: la minería de contenido, el uso de la minería y la minería estructura Web. identifica minería de contenido y clasifica los documentos útiles que contengan palabras o frases especificadas y elementos multimedia, como imágenes y gráficos, vídeo y audio, junto con las bases de datos y tablas. minería de uso web analiza los registros del servidor web, formularios de registro y otra información del usuario para recopilar información sobre el comportamiento del visitante, una vez que llegan a un sitio web específico. la minería estructura de la red intenta encontrar la relación entre los sitios web. Búsquedas recuperar información de los enlaces entrantes y salientes en cada página web para revelar patrones, popularidad, palabras clave similares o diferentes, contenidos o temas.

Caracteristicas

técnicas de minería Web pueden mejorar en gran medida los resultados de búsqueda motores de retorno. Muchas aplicaciones y programas de minería Web simplemente se centran el alcance de una búsqueda normal para obtener los datos o los patrones deseados. Otras aplicaciones utilizan consultas en lenguaje natural para buscar en la Web, el uso de herramientas especializadas que devuelven los resultados de búsqueda en una forma específica, como gráficos o estadísticas. minería de uso web se basa en el seguimiento de las acciones de los visitantes en cada sitio, incluyendo los enlaces elegidos y la cantidad de tiempo invertido en el sitio. Web estructura de minería devuelve los resultados que incluyen la fila de la página, la popularidad de enlaces, los recuentos de visitantes, e incluso el camino de entrada o salida de ese sitio los visitantes tomar.

beneficios

Los motores de búsqueda no indexan más del 50 por ciento de contenido de Internet. Encontrar este contenido es mucho tiempo para el usuario de Internet promedio, las empresas y los profesionales de búsqueda. arañas de búsqueda y los robots se pierda el contenido valioso porque sus fórmulas predefinidas no buscan tipos específicos de archivos o en el contenido de los archivos. aplicaciones de minería Web pueden devolver resultados de Wiki, documentos PDF y HTML que no son sitios web. A medida que Internet se vuelve más rico en contenido y como la variedad de que aumenta el contenido, la minería de datos ofrece a los usuarios de Internet más resultados relevantes y trae anteriormente contenido Web invisible a la superficie.

Potencial

Congreso y las agencias gubernamentales tienen dificultades para identificar el uso adecuado de los datos derivados de las actividades mineras Web. Una cuestión clave para la seguridad nacional es la política de privacidad que restringen el acceso a la información de seguimiento del usuario. Seguimiento del uso de Internet y correo electrónico en los sitios de trabajo deben ser sopesados ​​frente a la posibilidad de encontrar datos útiles que ayuda a las empresas y agencias gubernamentales a alcanzar las metas y objetivos. El acceso a las cookies de sitios y sitios ilegales y adultos presenta potenciales problemas de derechos civiles y humanos. inteligencia de negocio competitivo es recuperable por los informes anuales e intranets de empresas mineras. Estas necesidades deben ser sopesados ​​frente a los derechos de los individuos para navegar por la web anónima y acceder a la información públicamente disponible.