Deep Learning::Coisas Prontas & Datasets

Redes Prontas e Treinadas

Compilações

  1. Discussão interessante: Top 10 Pretrained Models to get you Started with Deep Learning (Part 1 – Computer Vision) – Indica vários modelos e paltaformas, sem focar em nenhum.

Keras/Tensor Flow

  1. Keras implementation of RetinaNet object detection – https://github.com/fizyr/keras-retinanet

PyTorch

  1. Awesome-Pytorch-list (Redes, Tutoriais, Extensões e Bibliotecas) – https://github.com/bharathgs/Awesome-pytorch-list
  2. Pretrained ConvNets for pytorch: NASNet, ResNeXt, ResNet, InceptionV4, InceptionResnetV2, Xception, DPN, etc. – https://github.com/Cadene/pretrained-models.pytorch
  3. PyTorch – pretrained torchvision and Emotion Recognition examples – http://www.robots.ox.ac.uk/~albanie/pytorch-models.html
  4. https://github.com/pytorch/vision/tree/master/torchvision/models

DNN (OpenCV)

  1.  nada ainda…

Outros

  1. Caffe Model Zoo – http://caffe.berkeleyvision.org/model_zoo.html

Imagens

  1. ImageNet Tree View
  2. COCO – Common Objects in Context
  3. The PASCAL Visual Object Classes
  4. Kitti Road dataset com download daqui
  5. Google Open Images Dataset V4
  6. Photo Aesthetics Ranking Network with Attributes and Content Adaptation
  7. AVA: A Large-Scale Database for Aesthetic Visual Analysis
  8. Stanford Background Dataset
  9. Sift Flow Dataset
  10. Barcelona Dataset
  11. Microsoft COCO dataset
  12. MSRC Dataset
  13. LITS Liver Tumor Segmentation Dataset
  14. Data from Games dataset
  15. Human parsing dataset
  16. Mapillary Vistas Dataset
  17. Microsoft AirSim
  18. MIT Scene Parsing Benchmark
  19. ADE20K Dataset
  20. INRIA Annotations for Graz-02
  21. Daimler dataset
  22. ISBI Challenge: Segmentation of neuronal structures in EM stacks
  23. INRIA Annotations for Graz-02 (IG02)
  24. Pratheepan Dataset
  25. Clothing Co-Parsing (CCP) Dataset
  26. Inria Aerial Image
  27. ApolloScape
  28. UrbanMapper3D
  29. RoadDetector

Fontes de Video

  1. Passagem de pessoas rua  – http://www.cxtv.com.br/camera-ao-vivo/temple-bar
  2. Distante  – http://www.cxtv.com.br/camera-ao-vivo/mashhad
  3. Mercado publico de Florianópolis, lateral e mesas  – http://www.pmf.sc.gov.br/temporeal/
  4. Mirante da Lagoa da Conceição – http://maaxcam.com.br/
  5. Loja Japonesa – https://www.insecam.org/en/view/690554/   e  http://www.svcl.ucsd.edu/projects/peoplecnt/

Datasets Gerais

  1. Medium::The 50 Best Public Datasets for Machine Learning

Bases para Benchmarks e Competições

ImageNet

The ImageNet project is a large visual database designed for use in visual object recognition software research. The ImageNet project runs an annual software contest, the ImageNet Large Scale Visual Recognition Challenge (ILSVRC), where software programs compete to correctly classify and detect objects and scenes.

 

PASCAL VOC – Visual Object Classes

The PASCAL VOC project: http://host.robots.ox.ac.uk/pascal/VOC/

  • Provides standardised image data sets for object class recognition
  • Provides a common set of tools for accessing the data sets and annotations
  • Enables evaluation and comparison of different methods 
  • Ran challenges evaluating performance on object class recognition (from 2005-2012, now finished)
  • Leaderboards for the Evaluations on PASCAL VOC Data

Pascal VOC data sets: Data sets from the VOC challenges are available through the challenge links below, and evalution of new methods on these data sets can be achieved through the  PASCAL VOC Evaluation Server.  The evaluation server will remain active even though the challenges have now finished.

Microsoft COCO – Common Objects in COntext

COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features: Object segmentation, Recognition in context, Superpixel stuff segmentation, 330K images (>200K labeled), 1.5 million object instances, 80 object categories, 91 stuff categories, 5 captions per image and 250,000 people with keypoints.

COCO:

CIFAR-10 e CIFAR-100

CIFAR-10 e CIFAR-100 são subconjuntos anotados do 80 million tiny images dataset. Foram coletados por Alex Krizhevsky, Vinod Nair e Geoffrey Hinton.É usado como referência para treinamento de muitos modelos de CNNs.

Google Open Images Dataset V4

google.v4

Kaggle

Kaggle é uma comunidade internacional de cientistas de dados e pesquisadores em Aprendizado de Máquina, famosa por suas competições de aprendizado de máquina, onde problemas específicos com datasets associados são postados e times de diferentes instituições e empresas competem para tentar resolver. Passou também a oferecer uma plataforma pública para armazenamento de datasets e um ambiente de oficina de aprendizado de máquina baseado em nuvem. Me Março de 2017 Google anunciou a aquisição de Kaggle, que continua a operar nos antigos moldes.

  • Site: https://www.kaggle.com/
  • Competições: this was Kaggle’s first product and still what the site is most famous for. Companies post problems and machine learners compete to build the best algorithm. In addition, Kaggle also has:
  • Kaggle Kernels: a cloud-based workbench for data science and machine learning. Allows data scientists to shore code and analysis in Python and R. Over 150K “kernels” (code snippets) have been shared on Kaggle covering everything from sentiment analysis to object detection.
  • Datasets: community members share datasets with each other. Has datasets on everything from bone x-rays to results from boxing bouts.
  • Kaggle Learn: cursos de IA de curta duração.

Alibabab Tianchi

Plataforma de Ciência de Dados e Aprendizado de Máquina do provedor de e-commerce Alibaba. Similar ao Kaggle, oferece competições, plataforma de deep learning, datasets, cursos e oportunidades de emprego.

InnoCentive

Empresa de inovação de crowdsourcing que também oferece competições e desafios similares ao Kaggle.

 

Copyright © 2018 Aldo von Wangenheim/INCoD/Universidade Federal de Santa Catarina

Sobre o Autor

possui graduação em Ciências da Computação pela Universidade Federal de Santa Catarina (1989) e Doutorado Acadêmico (Dr. rer.nat.) em Ciências da Computação pela Universidade de Kaiserslautern (1996). Atualmente é professor Associado da Universidade Federal de Santa Catarina, onde é professor do Programa de Pós-graduação em Ciência da Computação e dos cursos de graduação em Ciências da Computação e Sistemas de Informação. É também professor e orientador de doutorado do Programa de Pós-Graduação em Ciências da Computação da Universidade Federal do Paraná - UFPR. Tem experiência nas áreas de Produção de Conteúdo para TV Digital Interativa, Informática em Saúde, Processamento e Análise de Imagens e Engenharia Biomédica, com ênfase em Telemedicina, Telerradiologia, Sistemas de Auxílio ao Diagnóstico por Imagem e Processamento de Imagens Médicas, com foco nos seguintes temas: analise inteligente de imagens, DICOM, CBIR, informática médica, visão computacional e PACS. Coordena o Instituto Nacional de Ciência e Tecnologia para Convergência Digital - INCoD. É também Coordenador Técnico do Sistema Integrado Catarinense de Telemedicina e Telessaúde (STT/SC), coordenador do Grupo de Trabalho Normalização em Telessaúde do Comitê Permanente de Telessaúde/Ministério da Saúde e membro fundador e ex-coordenador da Comissão Informática em Saúde da ABNT - ABNT/CEET 00:001.78. Atualmente também é membro da comissão ISO/TC 215 - Health Informatics. Foi coordenador da RFP6 - Conteúdo - do SBTVD - Sistema Brasileiro de TV Digital/Ministério das Comunicações. Foi o criador e primeiro Coordenador do Núcleo de Telessaúde de Santa Catarina no âmbito do Programa Telessaúde Brasil do Ministério da Saúde e da OPAS - Organização Pan-Americana de Saúde e criador do Núcleo Santa Catarina da RUTE - Rede Universitária de Telemedicina.