Algebra Linear Numerica
Esta é a página oficial do curso de Álgebra Linear Numérica (graduação) do IPRJ/UERJ Nova Friburgo, 2023, contendo material potencialmente útil ao publico geral.
Informacao Basica
- Instrutor: prof. Ricardo Fabbri, Ph.D.
Horario
- Segundas 9:40-12:20 Sala 217
- Quintas 7:50-9:40 Sala 217
Duvidas: agendar individualmente com o professor ou procura-lo na sala 110
Avisos
- Por email
- Tambem ver Moodle (caso seja usado)
Software
- Usaremos o Scilab primariamente. Para explorar algoritmos de porte pequeno e médio com matrizes, as linguagens do tipo Lab (como Matlab, Scilab e Octave) são as mais simples, úteis e diretas.
- Ver funcoes svd, sva, e '\' (barra invertida)
- Python e Octave sao alternativas aceitaveis
Tarefas e Projetos
As tarefas devem ser formatadas com notacao matematica adequada, preferencialmente em Latex.
Somente serao aceitos arquivos eletronicos no formato PDF ou outro formato aberto como .odt
Quando a tarefa involver qualquer programacao, o aluno devera enviar o codigo fonte. O codigo junto com a documentacao devera estar dentro de um unico diretorio comprimido com .zip ou tar, com o nome do aluno, disciplina e data.
Enviar todo email com a tag "ALNIPRJ" no subject para garantir recebimento.
Tarefa 0
- Assistir videos introdutorios do curso relacionado ALN+ARN 2022:
- Motivacao dos cursos de Algebra Linear Numerica e Analise no Rn para computacao Prof Fabbri https://youtu.be/Tm5F2t3NriI
- Continuacao do prof Francisco https://youtu.be/1o-pUSbkQK (video privado - adicione a letra g ao final da URL)
- Ler Aula 1 Apostila da disciplina (apostila prof. Fabbri listada nas referencias)
- Professor ira escolher alunos para comentar em aula *parte por parte* do video, em especial discutiremos a opiniao do(a) aluno(a) sobre essas disciplinas no curso de computacao, e receber bonus
Tarefa 1
- SVD + Scilab
- Plotar circulo unitario
- Escolha uma matriz A
- Transformar cada ponto por A
- SVD visual: visualizar os eixos e esticamento da transformacao efetuada por A.
- Realizar SVD usando a funcao SVD propriamente dita
- Analise a relacao dos eixos encontrados visualmente com as matrizes U e V.
- Repetir com outras matrizes A, aleatorias e nao-aleatorias. Qual o poder de modelagem de matrizes na pratica que voce pode observar assim?
- Digitar o resultado, preferencialmente em Latex, e entregar por email ou impresso.
Tarefa 2: Ajuste de curvas
Uma das principais aplicações dos métodos numéricos de álgebra linear vistos em aulas consiste na solução de sistemas por mínimos quadrados. Isto, por sua vez, é muito útil para ajustar curvas algébricas (polinomiais) a dados experimentais, por exemplo: encontrar retas, círculos, ou outras cônicas que passam próximos de dado um conjunto de pontos.
- Ajuste de reta (opcional - para aprendizado apenas)
- simule a geração de um conjunto sintético de pontos "experimentais" ao longo de uma reta e os perturbe com a função rand() ao longo de cada coordenada
- use a "barra invertida" '\' do Scilab para gerar a curva que mais se aproxima dos pontos gerados
- plote seus resultados para diferentes intensidades de ruído
- Ajuste de cônicas (obrigatorio)
- simule a geração de um conjunto sintético de pontos "experimentais" ao longo de uma curva polinomial bi-dimensional de grau 2 (círculo, parábola, elipse..) e os perturbe com a função rand() ao longo de cada coordenada
- use a "barra invertida" '\' do Scilab para gerar a curva que mais se aproxima dos dados gerados
- plote seus resultados para diferentes intensidades de ruído
Projeto de Reconhecimento de Faces
Exemplo de Album com Algumas Faces (Facebook upload)
Exemplo de Faces detectadas, a serem reconhecidas no projeto (logo apos Facebook upload)
Procedimento
1) Monte um grupo de colegas, de 2-3 pessoas, para fazer o trabalho: Definir ate 1a aula apos P1 (2023: definir na apresentação de progresso parcial)
2) Baixe este conjunto de bases de dados de faces: RecDev
3) Inicie com a base de dados very-easy. Siga as instrucoes no README
4) Uma vez debugado seu reconhecedor, forneca uma taxa de acerto, usando validacao cruzada separando parte das fotos para treino, parte para teste, e fazendo uma media da taxa de acerto para varias particoes diferentes. Recomendo iniciar com o procedimento retirar 1 foto por pessoa para teste, e usar o restante para reconhecimento, e repetir o processo 10 vezes para comecar. O pseudocodigo fica assim:
erro_medio := 0 faca n vezes // n seria o numero de simulacoes, por exemplo, 10 bd_treino := base de dados completa (todas as fotos) para cada pessoa p bd_treino := bd_treino menos uma foto aleatoria da pessoa p adicione a bd_teste essa foto aleatoria treine seu reconhecedor com a base de dados bd_treino erro_novo := calcule a taxa de erro testando o reconhecedor nas fotos em bd_teste erro_medio := erro_medio + erro_novo fim faca erro_medio = erro_medio/n mostre o erro medio bonus: mostre a matriz de confusao
5) Use essa validacao cruzada para melhorar seu reconhecedor. Melhore esse codigo para poder examinar os casos de erro, analise, escreva no seu relatorio sua analise, e tente procurar a fonte do erro e melhorar o reconhecedor.
6) Sera dada maior nota aos alunos que implementarem esse codigo com indices, sem precisar copiar as fotos na memoria para gerar bd_treino e bd_teste. Ao ler imagens, seu codigo tambem devera ser independente do numero de imagens.
7) Uma vez debugado seu reconhecedor e validacao cruzada, rode nas bases easy, medium, hard e extras/facebookfaces e extras/facebookfaces2. Relate seus resultados e dificuldades. Se nao rodar em alguma dessas, ou se o relatorio nao tiver resultados condizentes, a nota sera penalizada.
- Recomendamos dividir o trabalho da seguinte forma: apos especificar a leitura da base de dados a partir dos arquivos e o formato da base de dados na linguagem, outro colega deve implementar a validacao cruzada.
- Seu codigo deve funcionar para um numero de fotos diferentes por pessoa. Por exemplo, 5 fotos para a pessoa 1, e 3 fotos para a pessoa 2.
- Pode assumir que as imagens sao 100x100
- Codigo para ajudar no trabalho: Rotinas PCA em scilab sip_pca.sci, sip_pca_project.sci. Use a seguinte rotina para aprender a usar este codigo: sip_pca_test.sce
- Fragmentos de codigo de anos anteriores (so pra ter uma ideia, o seu codigo devera ser muito melhor): aln-src
Entrega do Trabalho
- Apresentação Parcial (26jun23)
- Etapa 4 acima, e etapa 3 descrita no readme da base recdev (classificador simples e sua validacao)
- A apresentação será informal, todos os membros do grupo devem falar, e duvidas devem ser tiradas.
- Nao precisa fazer slides, mas sim rodar código na hora.
- Relatorio
- Data de entrega: 10jul23(era: 2 semanas antes da P2 até a meia-noite)
- Secoes Obrigatorias:
- Introducao
- Descricao clara do problema
- Descricao da implementacao
- Mais importante: Descricao do processo de desenvolvimento
- Experimentos, discussao, analise dos resultados e estudo detalhado dos casos de falha.
- Conclusao e ideias para trabalho futuro
- Cada membro do grupo deverá também escrever uma seção de, no mínimo, 2 páginas relatando sua contribuição e experiencia com o trabalho
- Codigo
- Data de entrega: 14jul23(era: 1 semana antes da P2 até a meia-noite) (melhoras podem ser entregues ate 3 dias antes da Pf)
- Dividir a entrega do codigo em 2 partes:
- Codigo-fonte
- README devera incluir instrucoes detalhadas de como rodar o codigo
- Calcular a taxa de acerto do algoritmo em validacao cruzada
- Codigo-fonte
Aviso:
- Criterio de avaliacao: A nota de trabalho sera dada com base na qualidade do relatorio
- Bonus #1: O grupo que tiver melhor performance obtera nota 10.0 no trabalho. O segundo melhor grupo obtera um bonus de 2 pontos no trabalho.
- A taxa de reconhecimento sera medida em uma base elaborada pelo professor durante a correcao, sem o conhecimento previo do aluno.
- A base de treinamento sera entregue ao aluno no mesmo formato da base recdev acima, no dia 10jul23
- A performance para bonus sera medida na presenca do professor, durante processo de correcao em horario de aula no dia 13jul23, usando-se uma base de teste fornecida no ato. O formato da base de teste sera da seguinte forma:
- arquivos no formato
<id_pessoa>-<id_foto>.jpg
todas na mesma pasta - Por exemplo, 17-3.jpg seria pessoa 17, foto numero 3 da base de teste
- Este id nao tem relacao com o id usado na base de treino
- Se houver mais de uma foto teste por pessoa, seu sistema pode usar todas essas fotos para tentar identificar a pessoa
- Tarefa do seu algoritmo: dadas diversas fotos de uma mesma pessoa desconhecida, do tipo:
17-1.jpg, 17-2.jpg, 17-3.jpg, 17-4.jpg, 17-5.jpg
Qual o id real dessa pessoa 17 na base de treino? Serao apresentadas varias pessoas, e o grupo que acertar mais vence. Nao sera permitido adaptacao do codigo, exceto para mostrar a pasta de teste.
- arquivos no formato
- O relatorio de cada aluno tambem devera conter um relato da participacao na competicao do bonus, e ira contar na nota do trabalho mesmo se nao ganhar o bonus
Projeto: Análise de Redes Sociais
Neste projeto o aluno coletara uma rede social, por exemplo a rede de amigos do facebook, ou uma rede de troca de mensagens de email, e fara uma análise dos nós mais importantes em relação a PageRank e outras características de difusão na topologia do grafo. Isso poderia ser util, por exemplo, para ordenar a sua lista de amigos por ordem de amigo mais "influente", ou para identificar maneiras de aumentar sua conexao na rede (por exemplo, numa rede de negocios).
Os passos do projeto sao:
- Obter sua rede social no formato GML
- Redes de troca de emails: http://hera.ethymos.com.br:1080/redes/python/autoRede/escolheRedes.php
- Sua rede amigos do facebook: http://snacourse.com/getnet/
- Visualizar a rede no software Gephi
- Baixe o Gephi em https://gephi.org
- Realize o tutorial basico do Gephi (do menu Help)
- Abrir o arquivo GML no Gephi
- Obter a matriz de Markov dessa rede no Scilab, considerando pesos nas arestas como no algoritmo PageRank
- Exportar a rede como matriz de adjacencias no Gephi (aprender como fazer)
- Calcular o autovetor dominante (PageRank) no Scilab
- Interpretar o que isso pode vir a dizer sobre a importância relativa dos seus amigos na rede de amizades
- Por exemplo, a pessoa tem muitos amigos que tem muitos amigos
- O que um caminhante aleatório ou quer dizer aqui? Discuta o que um processo de difusao significaria na rede de amizades. Talvez uma rede de indicacoes?
- Invente alguma outra medida nessa rede da importancia relativa dos nos
Links interessantes
- veja nossas aulas sobre grafos e matrizes
- labmacambira.sf.net/redes
- Análise de redes sociais
Conteudo aproximado
- Foco: SVD/Singular Value decomposition, auto-valores/auto-vetores, PCA/Principal Component Analysis, demais decomposicoes matriciais.
Recursos principais
- Apostila prof. Fabbri
- Excelente livro recente cobrindo partes deste curso: Applied Linear Algebra, Peter J. Olver and Chehrzad Shakiban
- Livro classico: "Matrix Computations", Gene Golub et. al. (inventor do algoritimo mais usado de SVD).
Outros Recursos
- Nao ha livro texto no nivel desta disciplina. mas veja a bibliografia do curso de Analise Matricial da Pos:
- Outro livro: "Numerical Matrix Analysis", Ilse Ipsen
- Veja tambem os livros do Gilbert Strang.
- Notas sobre sistemas de coordenadas, matriz relativa a dadas bases, rotacoes (pdf)
Aulas: Listagem parcial
- Primeiras aulas: overview, SVD, PCA, aplicacoes, notacao, bases vs sistemas de coordenadas
- Rotacoes e Sistemas de Coordenadas
- Rotacoes e Sistemas de Coordenadas
- SVD
- Aula Informal projeto e relatorio eigenfaces/PCA
- Aula Informal PCA
- Grafos e matrizes, cadeias de Markov, laplaciano de grafos
- PageRank e outras tecnicas de Ranking, reducao de dimensionalidade, e machine learning. Ver tambem [1]
Para referencia: aulas de Analise Matricial: listagem parcial
- Matrizes, Notacao e Conceitos Elementares (~cap 1 livro)
- Sensitividade, Erros e Normas - parte 1 (cobre cap 2 livro ate normas de matrizes)
Provas
- P1: Provas anteriores: 2012
- P2: 17jul23
- Final-Sub: 24jul23
Criterio de Avaliacao
- Trabalhos: 20% da media - o ultimo trabalho (reconhecimento) valera a metade disto, ou seja, 10% da media.
- Bonus de participacao: 10%-20% a nota total trabalhos e tarefas T, adicionais. A criterio do professor, incluindo presenca em aula, participacao em aula, esforco de realizar tarefas excelentes e ir alem do esperado.
- O criterio final ficou (favor avisar se precisar adicionar detalhes ou corrigir no caso de erro/discrepancia):
M_p = (P1 + P2)/2 M = 0.8*M_p + 0.2*T (atualizado de 10% para 20% com acordo dos alunos), onde T é a nota dos trabalhos Se M >= 5, passou --> M (facilitando: considere T=10,0 no M `a esquerda desta desigualdade aqui) prova final - faz quem quiser, mas combinamos que teria de seria feita por quem obtiver M < 5 - facilitando: considere T=10,0 e calcule uma media M otimista, para ver se precisa fazer a final. ou seja:
- Se M_p < 6.25, precisa fazer final! *************************
M_f = 0.5*(M + P_f) = 0.5*(0.8M_p + 0.2*T + P_f) = 0.2*P1 + 0.2*P2 + 0.5*P_f + 0.1*T Se M_f >= 5, passa --> M_f Sub: repoe menor de P1, P2, P_f (apenas se alguem faltou alguma prova ou quiser melhorar nota - mas quem entregar ira substituir) M_sub = media com sub Se M_sub >= 5, passou --> M_sub
Adendo (em acordo com os alunos): a M_sub = M_f pois sera considerada a mesma prova. Quem for usar a prova como Sub ira substituir a nota independentemente do resultado.
Awesome Links
- Curso moderno e basico on-line da Brown University sobre algebra linear e aplicacoes [2]
- Curso on-line da University of Texas at Austin, Linear Algebra - Foundations to Frontiers: Learn the theory of linear algebra hand-in-hand with the practice of software library development [3]