2. Introdução ao conceito de digitalização Processo de capturar dados em formato analógico e transformá-los em um formato digital; Quantidade de variações infinita -> finita.
4. Pixel Pixel (px) – PICture ELement; Menor elemento de uma imagem rasterizada ( raster ). -> =
5. Resolução Tamanho em pixels no eixo xy (largura x altura); Pode ser expressa diretamente (por ex. 640 × 480 px) ou indiretamente (3.1 Mpx ≈ 2048 × 1536 = 3.145.728 px).
6. Profundidade de Cor Quantidade de variação de cor possível para cada pixel; Por exemplo, no sistema de cor RGB em 24 bits, temos 8 bits para cada cor primária (vermelho, verde, azul), ou 32 bits se considerarmos 8 bits para o canal alpha (transparência). Portanto para cada cor primária temos 2 8 = FF = 256 variações possíveis, gerando então 256 3 = 2 8³ = FFFFFF = 16.777.216 de cores possíveis.
8. Imagem como matriz de números Para o computador, uma imagem é uma matriz de números; Para armazenar essa imagem e apresentá-la para o usuário, existem diferentes processos matemáticos (algoritmos) de COdificação e DECodificação. A esta dupla de processos, damos o nome de codec .
9. Com ou sem perdas? Existem diferentes codecs, os que apresentam perda ( lossy ) e os que não apresentam ( lossless ); A perda, neste caso, significa literalmente jogar fora algum dado que não seja relevante para a percepção humana em troca de um menor tamanho de arquivo. É um processo irreversível.
10. Alguns codecs de imagem Com perda Sem perda JPEG (Joint Photographic Experts Group) (jpg) Portable Network Graphics (png)
11. Áudio Taxa de Amostragem Resolução Canais Taxa de Bits
12. Áudio – Vibrações e Impulsos Elétricos Os sons que ouvimos são vibrações dos objetos e do meio (ar). Nossos ouvidos tem sensores que captam as vibrações e enviam para o cérebro na forma de impulsos elétricos; De forma semelhante, um microfone capta vibrações e as transforma em impulsos elétricos.
13. Convertendo Impulsos Elétricos em Bits Ao entrar no computador, o áudio deverá passar por um processo de conversão em que os sinais elétricos analógicos deverão ser convertidos em sinais digitais, o ADC – Conversor Analógico-Digital; Analogamente, ao serem eproduzidos, os sinais passarão por um conversor que funciona de maneira inversa, o DAC – Conversor Digital-Analógico.
14. Taxa de Amostragem ( Sampling Rate ) É a quantidade de vezes por segundo que o sinal elétrico é medido numa determinada resolução; Por ser uma frequência t em a medida em hertz (Hz), geralmente variando entre 8000 Hz (8 kHz) e 192 kHz.
15. Taxas de Amostragem padrões Usualmente as taxas de amostragem são 44100 Hz (44.1KHz), utilizada nos CDs de áudio e na maioria dos arquivos de áudio da internet, ou 48KHz no áudio dos DVDs de vídeo; Taxas mais baixas em geral são utilizadas apenas em equipamentos eletrônicos com propósitos específicos, como um telefone, e taxas mais altas apenas para gravação profissional em estúdio ou em sistemas de alta fidelidade sonora.
16. Resolução É a quantidade de bits utilizada em cada amostragem; Geralmente a resolução varia de 8 bits a 32 bits, sendo 16 bits um valor comum (CDs de áudio).
17. Canais É a quantidade de diferentes áudios reproduzidos simultaneamente; Valores comuns são: 1 (mono ou monoaural), 2 (estéreo), 4 (quadrifônico), 6 (5.1), 8 (7.1).
18. Taxa de bits ( Bit Rate ou Bitrate ) É a multiplicação de todos os fatores anteriores, sendo uma forma de se verificar indiretamente a qualidade do processo de conversão; É sempre expressado em bits por segundo (b/s ou bps). Para ter-se uma ideia do espaço ocupado em disco ou da banda necessária para transmitir pela internet, você pode dividir o valor por 8 para obter bytes por segundo (B/s ou Bps), mas a unidade padrão é o bit.
19. Taxa de bits de um CD de Áudio Tomemos por exemplo um CD de áudio. Nele, as músicas são codificadas em 2 canais de 16 bits amostrados (sampleados) a 44.1KHz. 2 × 16 × 44100 = 1.411.200 = 1.411,2 kbps = 176,4 kB/s Dependendo do codec, o bitrate pode ser constante (CBR) ou ser variável (VBR). Neste caso, ele determina que determinadas partes podem ter um bitrate menor que outras mantendo uma mesma qualidade.
20. Codec versus Container Vamos agora apresentar dois elementos técnicos, o codec e o container . Essa clarificação é necessária pois nos formatos de imagem, o codec e o container são uma coisa só; o mesmo não acontece sempre nos formatos audiovisuais.
21. Codec versus Container Codec (de COdificador-DECodificador) é um algoritmo (fórmula matemática) que representa e converte os dados. Dependendo do codec, pode ser utilizado de forma independente ou atrelado a um container. Container é uma forma de se armazenar ou expressar um dado codificado. Dependendo do container, ele pode armazenar dados de codecs de áudio, vídeo e outros, como informações sobre o artista, legendas etc.
22. Codecs de áudio Formas de representar os dados sonoros que, quando convertidos de volta, representarão pulsos elétricos na caixa de som. Também se dividem entre lossy e lossless .
23. Codecs de áudio sem perda ( lossless ) Pulse-code modulation (PCM) - usado em sistemas telefônicos digitais, teclados eletrônicos, CDs de áudio. É uma forma de dados bruta, que poderia também ser usada em vídeo se o resultado não fosse muito custoso. Free Lossless Audio Codec (flac)
24. Codecs de áudio com perda ( lossy ) MPEG-1 Audio Layer 3 (mp3) Advanced Audio Coding (aac) Microsoft WMF – Windows Media Audio (wma) Ogg Vorbis (ogg, oga)
25. Containers de áudio Microsoft Wave PCM (wav) Apple Audio Interchange File Format (aiff) MPEG-4 Part 14 (mp4, m4a) Ogg (ogg, oga)
26. Vídeo Vídeo é imagem em movimento, em geral com um ou mais canais de áudio anexados. Portanto, combina a as propriedades do áudio (taxa de amostragem, resolução, canais, taxa de bits de áudio) com a das imagens (pixel, resolução), com um determinado número de quadros por segundo e dando uma taxa de bits total.
27. Taxa de quadros Quantidade de vezes que a figura é atualizada por segundo no vídeo, gerando a impressão de movimento. É expressa em quadros por segundo (fps). Valores comuns são: 15 fps, 24 fps (cinema), 25 fps (PAL), 29.97 fps (NTSC).
28. Resolução de vídeo Resolução das imagens que compõem o vídeo, expressa em pixels. Tão importante quanto o tamanho em pixels é a proporção entre a largura e a altura, usualmente 4:3 ( tele ) e 16:9 ( wide ). Frequentemente se utiliza siglas que representam algumas resoluções padrão.
29. Resoluções de vídeo digital 4:3 ( tele ) Valores comuns em computadores e dispositivos móveis: 320x240 (QVGA) 352x288 (QCIF) 500x375 640x480 (VGA) 800x600 (SVGA) 1024x768 (XGA)
30. Resoluções de vídeo digital 16:9 ( widescreen ) Valores comuns em sistemas de vídeo digital 16:9: 720x480 (SD) 1280x720 (HD) 1920x1080 (Full HD)
31.
32. Taxa de bits Taxa de bits utilizada para se expressar os dados de vídeo. Funciona de forma semelhante à taxa de bits de áudio. Não se armazena vídeo sem compressão, pois isto requeriria muito espaço.
33. Compressão Sempre! Mesmo nos ditos formatos de vídeos brutos (de câmeras DV) usa-se um mínimo de compressão possível, para que se tenha um arquivo não muito grande sem muita perda qualidade de imagem. Em outras palavras, o vídeo é descomprimido apenas durante a exibição. Para entender o porquê, algumas contas simples: Vamos supor 1h de vídeo em resolução standard (720 × 480) a 30fps, profundidade de cor de 24 bits com 6 canais de áudio em 16 bits a 48Khz (5.1), isto é, o padrão DVD Vídeo:
35. Codecs de vídeo Intel Real Time (Indeo), Cinepak, Motion JPEG, codecs antigos que usam o container AVI MPEG-1 Part 2 – VCD MPEG-2 Part 2 – DVD, DVB (DTV européia) e ATSC (DTV norte-americana) H.263 - videoconferências, vídeo de internet Sorenson Spark, implentação do H.263 usado no Flash 6 On2 Technologies VP6, VP7 – usados no Flash 8
36. Codecs de vídeo Theora - codec livre de patentes baseado no On2 Techonologies VP3 MPEG-4 Part 2 – destinado a bitrates baixos DivX, Xvid, 3ivx são diferentes implementações do MPEG-4 Part 2 Microsoft WMF - Windows Media Video
37. Codecs de vídeo MPEG-4 Part 10 – Advanced Video Coding (AVC), também conhecido por H.264 – Bluray, ISDB-Tb, YouTube HQ, iPhone etc. Dirac – em desenvolvimento (BBC) Sorenson 3 – antecessor do H.264, popularizado pelo QuickTime da Apple * MPEG – Moving Picture Experts Group
38. Containers Audio Video Interleave (avi) Apple Quicktime Container Format (mov) Ogg (ogg, oga, ogv) Matroska (mkv) MPEG-4 Part 14 (mp4)
39. Gerenciamento de Restrições Digitais (DRM) Certos codecs e containers implementam o chamado Gerenciamento de Restrições Digitais (DRM). Tais sistemas supostamente deveriam proteger o detentor dos direitos da obra impedindo os usuários de trocarem os arquivos de forma ilegal, como via P2P. Por outro lado, o DRM impede o usufruto completo e legítimo do comprador da mídia, por exemplo, usuários que comprem um filme e queiram fazer uma cópia de segurança (o que a lei permite).
40. Gerenciamento de Restrições Digitais (DRM) Diversos hackers tem tentado (e conseguido) criar algoritmos que quebrem tais restrições, tais como o DeCSS, que tira a restrição de cópia de DVDs de vídeo. Embora a nova geração de mídia de vídeo (BluRay) ainda tenha DRM, pouco a pouco a indústria começa a acordar para o fato de que DRM é nocivo. A Apple, por exemplo, agora vende músicas na iTunes Store sem DRM.
41. Tocando e editando Caso você se interesse apenas em tocar os arquivos, basta instalar um player que já venha com os codecs embutidos. Um dos melhores, multiplataforma e opensource é o VLC - http://videolan.org/vlc Caso você queira criar vídeos no Windows ou tocar vídeos com codecs novos em players antigos sem suporte (como Win. Media Player), você deve instalar os codecs, separadamente ou - preferencialmente - através de um pacote único. Recomendo o CCCP - Combined Community Codec Pack http://cccp-project.net/
42. Direcionamentos AAC (áudio), AVC/H.264 (vídeo) e MPEG-4 Part 14 (container mp4) - codecs "do momento", suportados em praticamente todos os dispositivos novos; Ogg Vorbis (áudio) e Ogg Theora (vídeo) - codecs livres que provavelmente ganharão mais visibilidade com o lançamento do HTML 5 (que implementa tags <audio> e <video>) e seu suporte nativo no Firefox 3.5 e Opera 10; Matroska - container que traz possibilidades muito interessantes tais como embutir vídeo, diversos áudios, legendas e menu tal como um filme em DVD/BD em um único arquivo.
46. Licença Esta apresentação está sob a licença Creative Commons Atribuição-Compartilhamento pela mesma licença – CC-BY-SA e está disponível no meu blog: nighto.net