Darkbert
Enciclopedia > ► Tecnología
Darkbert
DarkBERT es la IA que descifra el lenguaje de la dark web. La web oscura es una parte oculta de Internet a la que solo se puede acceder a través de un navegador especial como Tor. A menudo se usa para actividades ilegales como el tráfico de drogas, la piratería informática y los delitos cibernéticos. La web oscura también tiene una cultura propia y utiliza un lenguaje codificado que dificulta la comprensión de los "forasteros". Para abordar este desafío, los investigadores de Corea del Sur han desarrollado un nuevo modelo de lenguaje llamado DarkBERT que se entrena con datos de la web oscura. DarkBERT se basa en la arquitectura RoBERTa, un modelo de IA de última generación capaz de procesar grandes cantidades de texto y generar respuestas en lenguaje natural. DarkBERT puede analizar un nuevo contenido de la web oscura y extraer información útil, como el tema, el sentimiento y la intención del autor. DarkBERT es el resultado de un enorme proceso de recopilación y filtrado de datos. Los investigadores rastrearon la web oscura a través de la red Tor y recopilaron más de 1200 millones de palabras de texto de varias fuentes, como foros, blogs, mercados y salas de chat. Luego aplicaron técnicas como la deduplicación, el equilibrio de categorías y el preprocesamiento de datos para generar una base de datos web oscura de alta calidad. Usaron esta base de datos para refinar el modelo RoBERTa y crear DarkBERT.