Tagging - Um tipo de Aprendizado Supervisionado Multi-Label
Em algumas situações a classificação binária não é suficiente.
Nem todos os problemas de classificação se encaixam perfeitamente em um problema de classificação binário ou de multi-classes. Um classificador para distinguir se a imagem refere-se a um gato ou cão é fácil de implementar com as ferramentas que temos hoje, mas como classificar os animais da figura abaixo onde temos 4 animais diferentes?
A imagem tem um gato, cão, galo e um burro. Um problema de classificação não funcionaria muito bem, o ideal seria que a imagem fosse descrita informando todos os animais que encontrou na imagem.
Esses problemas de prever classes que não são mutualmente exclusivas são também chamados de classificação multi-label.
Também pode ser chamado de auto-tagging. Pense em livros que podem ser classificados em mais de um gênero (ficção científica, drama) ou posts técnicos aqui que podem ser de "machine learning", "gadgets" e "programação". Um artigo típico pode ter de 5–10 tags de assuntos correlatos. Artigos sobre "cloud computing" normalmente acabam mencionando AWS, Azure ou Google Cloud.
Esses problemas também acontecem na literatura médica, onde o tagging correto de um artigo permite que os pesquisadores possam fazer exaustivas revisões do texto. Na biblioteca nacional de medicina nos EUA, exitem profissionais especializados em associar artigos indexados no PubMed a termos relevantes do MeSH, uma coleção de 28000 tags. Machine learning pode prover tags provisórias para esses artigos até que sejam manualmente revistos.
A área de marketing também tem interesse nessa área, pois o correto tagging de um conteúdo, artigo, fotos, e etc pode ajudar a direcionar as campanhas de marketing corretamente. Por exemplo, o Facebook pode notar que você gosta de andar de bicicleta ao postar muitas fotos com bicicletas. Com essa informação, entrega anúncios de esportes e de lojas de bicicletas pra você com maior frequência do que para o seu primo que só posta fotos jogando futebol.
Já sabia a importância do tipo de aprendizado supervisionado tagging ou multi-label?
Para mais conteúdo de machine learning e data science acesse @aprendadatascience .