Visão Computacional
De Pontão Nós Digitais
Ir para navegaçãoIr para pesquisar
Esta é a pagina principal do curso de visão computacional de graduacao e pos-graduacao ministrado em 2013/2 no IPRJ/UERJ, de utilidade geral para a formação de programadores de nivel intermediario e avancado para desenvolvimento de software multimídia, aplicativos interativos, dentre outros.
Informacoes gerais
- Instrutor: prof. Ricardo Fabbri, Ph.D.
- Periodo: 2o. Semestre de 2013, voltado ao 10o. periodo de Engenharia da Computacao
- Tercas 2:20pm-4:00pm sala 211 e Quintas 1:20pm-3:10pm, sala 212. Alguns dias no Lab Inf xx
Pre-requisitos
O aluno deverá saber conceitos básicos de programação e conseguir aprender linguagens rapidamente sob demanda durante o curso. Experiência previa com algebra linear e calculo vetorial altamente recomendados.
Software
A linguagem a ser utilizada para aprendizado sera o Scilab, C++, e Pd.
Conteudo aproximado
- Introducao, processamento de imagens basico, ajustes, morfologia matematica
- Filtros, Transformadas de Fourier, Piramides e Wavelets
- Deteccao e Ligacao de bordas e pontos de interesse
- Cores e Iluminacao
- Reconstrucao 3D e Auto-calibracao esparsa de Cameras
- Geometria de visao estereo bifocal, trifocal e multifocal
- Fluxo optico e estimacao de movimento 3D denso e nao-rigido
- Reconhecimento, Aprendizado de Maquina, Manifold Learning
Recursos principais
- Grupo de discussao: uerj.tk
Bibliografia
- Principal 1: Computer Vision, Richard Szeliski, cujo pdf se encontra on-line: http://szeliski.org/Book
- Principal 2: Shape Classification and Analysis, 2nd. Ed., Luciano da Fontoura Costa & Roberto Marcondes Cesar Jr.
- Usaremos este livro para muito do material dado em aula
Aulas
Um video sobre aspectos interessantes da tecnologia sera apresentado a cada aula.
- Introducao - videos, demos, formato do curso
- Aula 2 - conceitos fundamentais e notacao
- inspiring video: http://youtu.be/Oie1ZXWceqM
- Equalizacao de Histogramas e Outras Tecnicas de Realce - 10/out/2013
- inspiring video: https://vimeo.com/36239715
- Filtragem de Imagens no dominio espacial, parte 1
- Filtragem de Imagens no dominio da frequencia, transformada de Fourier, aliasing (pdf | keynote)
- inspiring video: water spiral vs framerate
- Morfologia Matematica, Geometria Discreta, Componentes Conexos, Transformadas de Distancia, Esqueletizacao, Diagramas de Voronoi (pdf | keynote) - 16/out/2013
- Pontos de Interesse - ate 5/nov/2013
- Notas de aula sobre detector e descritor SIFT (feito `a mao)
- tambem foi seguido partes do slide[1]
- Harris corners and related ideas
- Notas de aula sobre detector e descritor SIFT (feito `a mao)
- Ajuste robusto: RANSAC, Hough Transform, Robust least squares
- Cor e Luz: Fisica, Percepcao, Deteccao
Recursos adicionais
Links
- Computer Vision research course at Brown Engineering, 2013 - ENGN 2560
- Image Understanding course at Brown Engineering (basic to intermediate level)
- 2013 course http://mesh.brown.edu/engn1610
- 2011 course http://vision.lems.brown.edu/engn161/fall2011
- Computer Vision course at Brown Computer Science (basic to intermediate) http://cs.brown.edu/courses/cs143
- Curso de Computacao Paralela do IPRJ: incluindo CUDA
- Curso de Álgebra Linear Numérica do IPRJ: muitos conceitos úteis para visao computacional e computação gráfica
- Curso de Computacao Grafica do IPRJ
- Curso de Teoria dos Padroes do IPRJ: aprendizagem de maquina, tecnicas estocasticas, vertente importante de Visao Computacional
- OpeCV, VXL, SIP: bibliotecas de visao computacional em C/C++ e Scilab, respectivamente.
Provas
Tarefas
Labs
Download dos Labs
Todo material dos trabalhos (imagens, pdfs, etc) pode ser baixado e atualizado pelo Git [2]:
git clone https://github.com/rfabbri/vision-course.git
Lab1: Processamento ponto a ponto
- Enunciado
- As imagens necessarias estao no repositorio Git[3]
- Data de entrega: quarta-feira 13/Nov/2013 ate a meia-noite. Atrasos serao aceitos porem somente com reducao na nota.
Instrucoes para Submissao
- A solucao deve ser digitada em um relatorio e entregue no formato pdf.
- Incluir tambem todo o codigo fonte e dados gerados
- Enviar um arquivo zipado com tudo (scripts scilab, relatorio, etc) por email, no formato:
<sobrenome>-<nome>-visao-computacional-lab<numero_lab>.zip
Projetos
- Ideia 1: selecionar alguma destas excelentes opcoes: http://vision.lems.brown.edu/content/engn-2560-projects