Open source intelligence approach with self-organizing maps of kohonen and natural language processing for automatic execution of dorks

التفاصيل البيبلوغرافية
العنوان: Open source intelligence approach with self-organizing maps of kohonen and natural language processing for automatic execution of dorks
المؤلفون: Evangelista, João Rafael Gonçalves
المساهمون: Sassi, Renato José, Chaves, Marcirio Silveira, Napolitano, Domingos Marcio Rodrigues, Belan, Peterson Adriano
المصدر: Biblioteca Digital de Teses e Dissertações da Uninove
Universidade Nove de Julho (UNINOVE)
instacron:UNINOVE
بيانات النشر: Universidade Nove de Julho, 2020.
سنة النشر: 2020
مصطلحات موضوعية: dorks, processamento de linguagem natural, automatic pentest, self-organizing maps, SISTEMAS DE COMPUTACAO [CIENCIA DA COMPUTACAO], natural language processing, OSINT, inteligência de fontes abertas, mapas auto-organizáveis de Kohonen, open source intelligence, pentest automático
الوصف: Submitted by Nadir Basilio (nadirsb@uninove.br) on 2021-10-05T15:36:19Z No. of bitstreams: 1 João Rafael Gonçalves Evangelista.pdf: 3820367 bytes, checksum: 910e29492d2b0c725d2086ede02c9b44 (MD5) Made available in DSpace on 2021-10-05T15:36:19Z (GMT). No. of bitstreams: 1 João Rafael Gonçalves Evangelista.pdf: 3820367 bytes, checksum: 910e29492d2b0c725d2086ede02c9b44 (MD5) Previous issue date: 2020-06-29 To protect the information located on the Internet, the Information Security area has a process to test the security of web pages, called Intrusion Test or Pentest. In its initial phase, the test performs searches on Web pages to gather or obtain the maximum information available to support other phases of the process, or even, find some vulnerabilities. This phase is called Open Source Intelligence (OSINT). A practice for OSINT used in Pentest is Google Hacking, which works using strings called Dorks. Google Hacking can be performed in two ways: manual and automatic, and the first has a longer duration than the second. One way to improve Pentest performance is to make it automatic with the application of Artificial Intelligence (AI) techniques, such as Kohonen's Self-Organizing Maps (SOM), a type of artificial neural network used to generate clusters, and Natural Language Processing (PLN), a subarea of AI responsible for making computers able to interpret and develop content in human language. So, the objective of this work was to develop an Open Source Intelligence Approach with Kohonen's Self-Organizing Maps and Natural Language Processing for automatic execution of Dorks to improve the performance of the Google Hacking practice. The selected database was the Google Hacking Database (GHDB), containing 4,211 Dorks and 4 attributes. The approach proposed in this work was developed in 10 phases: preparing the environment to run OSINT, defining the OSINT scope, selecting the Dorks base, selecting and evaluating the OSINT tools, pre-processing the Dorks base, transforming the Dorks base, application of SOM in the Dorks base, analysis of results, addition of new information in the Dorks database and validation of the automatic execution of Dorks. The results obtained revealed a better performance of the proposed approach when automatically executing the Dorks base compared to manual execution. It was concluded, then, that Open Source Intelligence Approach with Kohonen's Self-Organizing Maps and Natural Language Processing can be applied in the automatic execution of Dorks. Para proteger as informações localizadas na internet, a área da Segurança da Informação dispõe de um processo para testar a segurança de páginas web, denominado Teste de Intrusão ou Pentest. Em sua fase inicial, o teste visa realizar buscas na internet a fim de reunir o máximo de informações disponíveis para apoiar as demais fases do processo e, até mesmo, já encontrar algumas vulnerabilidades. Essa fase inicial é chamada de Inteligência de Fontes Abertas, ou, em inglês, Open Source Intelligence (OSINT). Uma prática para OSINT utilizada em Pentest é o Google Hacking, que funciona aplicando strings denominadas Dorks. O Google Hacking pode ser executado de duas formas: manual e automática, sendo que a primeira possui um tempo de duração superior ao da segunda. Uma maneira de melhorar o desempenho do Pentest é torná-lo automático com a aplicação de técnicas de Inteligência Artificial (IA), como os Mapas Auto-Organizáveis (SOM) de Kohonen, um tipo de rede neural artificial utilizada para gerar agrupamentos, e o Processamento de Linguagem Natural (PLN), uma subárea da IA responsável por fazer com que os computadores interpretem e desenvolvam conteúdo em linguagem humana. Assim, o objetivo deste trabalho foi desenvolver uma abordagem de Inteligência de Fontes Abertas, por meio dos Mapas Auto-Organizáveis de Kohonen e do Processamento de Linguagem Natural, para execução automática de Dorks, a fim de melhorar o desempenho da prática do Google Hacking. A base de dados selecionada foi o Google Hacking Database (GHDB), contendo 4.211 Dorks e 4 atributos. A abordagem proposta neste trabalho foi desenvolvida em 10 fases: preparação do ambiente para executar o OSINT, definição do escopo de OSINT, seleção da base de Dorks, seleção e avaliação das ferramentas OSINT, pré-processamento da base de Dorks, transformação da base de Dorks, aplicação da rede SOM na base de Dorks, análise dos resultados, adição das novas informações na base de Dorks e validação da execução automática de Dorks. Os resultados obtidos apontaram um melhor desempenho da abordagem proposta quando executada automaticamente a base de Dorks comparada à execução manual. Desta forma, concluiu-se que a abordagem de Inteligência de Fontes Abertas, utilizando Mapas Auto-Organizáveis de Kohonen e Processamento de Linguagem Natural, pode ser aplicada na execução automática de Dorks.
وصف الملف: application/pdf
اللغة: Portuguese
URL الوصول: https://explore.openaire.eu/search/publication?articleId=od______3056::15223bb083eeb88d35312bb3e0b9175f
http://bibliotecatede.uninove.br/handle/tede/2586
حقوق: OPEN
رقم الأكسشن: edsair.od......3056..15223bb083eeb88d35312bb3e0b9175f
قاعدة البيانات: OpenAIRE