Tänään tarkasteltiin Fourier muunnoksen ominaisuuksia, sovelluksia sekä nopeaa toteutusta.
Luennon aluksi esiteltiin alkeellinen menetelmä puheen tunnistukseen. Kirjan Elements of statistical learning kappaleessa
5.2.3 opetetaan tietokone erottelemaan kaksi vokaalia niiden
Fourier-muunnosten perusteella. Menetelmä on nimeltään logistinen regressio,
joka monimutkaisista kaavoista huolimatta on varsin yksinkertainen
toteuttaa: menetelmä etsii kertoimet kullekin Fourier-muunnoksen
taajuudelle, ja laskee tulokset yhteen. Jos luku on positiivinen,
tulkitaan äänne ä-kirjaimeksi, muutoin a-kirjaimeksi.
Menetelmää demottiin Matlab-toteutuksella, jossa luokittelija opetettiin erottamaan S-äänne muista äänteistä. Menetelmä toimi hyvin miesäänellä, mutta vain kohtalaisesti naisäänellä.
Esimerkki
kuvaa hyvin tämän päivän signaalinkäsittelyalgoritmia: perusmenetelmiä
(Fourier-muunnos, konvoluutio, jne.) käytetään piirregeneraattoreina,
jotka tuottavat hieman parempaa raakadataa kuin suora mittaussignaali
(esim. taajuustietoa eikä raakaa mittausdataa). Laskettujen piirteiden
perusteella sitten nostetaan tiedon abstraktiotasoa edelleen.
Esimerkiksi äänteen tunnistuksessa hierarkia on esimerkiksi seuraava:
48000 aikatason näytettä -> 256 taajuustason kerrointa -> 1 bitti, joka kertoo kumpi äänne on kyseessä
Tämän
jälkeen siirryttiin tarkastelemaan Fourier-muunnoksen ominaisuuksia.
Ominaisuuksista tutustuttiin lähemmin siirtoon ajassa (esim. laske
signaalin x(n+20) muunnos, kun tiedetään x(n):n muunnos) sekä konvoluution muunnokseen (DFT muuntaa konvoluution kertolaskuksi, eli x(n)*y(n) -> X(n)Y(n)). Tämä on perustana mm. dekonvoluutiolle joka on konvoluutiolle käänteinen operaatio. Menetelmää käytettiin mm. Hubble-teleskoopin alkuaikoina,
jolloin yhdessä peilissä olleen hiontavirheen vuoksikuvat olivat
sumuisia. Kuvantamisprosessia voidaan nimittäin mallintaa
(kaksilulotteisella) konvoluutiolla
y(n,m) = h(n,m) * x(n,m),
missä x on todellinen näkymä, y on havaittu sumuinen kuva, ja h on linssin impulssivaste (nk. point spread function; PSF). Yhtälössä y ja h ovat tunnettuja, ja tehtävänä on ratkaista x. Ratkaisu löytyy taajuustasossa, koska
Y(n,m) = H(n,m) X(n,m),
joten (Matlabin syntaksilla ilmaistuna):
x(n,m) = ifft (Y(n,m) ./ H(n,m)).
Dekonvoluutiosta on hyötyä yleisemminkin lineaarisen kanavan aiheuttaman häiriön poistossa. Jos tiedetään signaalin x kulkeneen kanavan h läpi, voidaan vastaanotetusta mittaustuloksesta ypäätellä x, jos meillä on joku käsitys kanavasta h. Esimerkkinä tästä mainittiin langattoman tiedonsiirtokanavan estimointi ja sen aiheuttaman vääristymän kompensointi.
Toinen menetelmän tuottama etu on että Fourier-muunnoksen (käytännössä FFT:n) avulla voidaan laskea konvoluutio kaavasta (Matlabin syntaksilla ilmaistuna):
conv(x,y) = ifft(fft(x) .* fft(y))
Luennon lopuksi käsiteltiin nopeaa Fourier-muunnosta eli FFT:tä,
joka on vain nopeampi tapa toteuttaa diskreetti Fourier-muunnos (DFT).
FFT perustuu signaalin jakamiseen lyhyempiin pätkiin, jotka muunnetaan
jakamalla ne edelleen rekursiivisesti kahtia. Rekursio päättyy, kun
muunnoksen pituus on 1, jolloin muunnosta ei tarvitse enää tehdä.
1-ulotteisen vektorin tapauksessa muunnosmatriisi on yksinkertaisesti F =
[1], joka tarkoittaa pelkkää ykkösellä kertomista eikä sitä tarvitse
tehdä. Lyhyemmistä vektoreista saadaan koostettua pidemmät vektorit
kaavoilla (3.3) ja (3.4).
keskiviikko 29. tammikuuta 2014
keskiviikko 22. tammikuuta 2014
Fourier-muunnos
Luennon
aluksi käsiteltiin kappale 2 loppuun. Tällöin tutustuttiin konvoluution
ominaisuuksiin (laskentasäännöt: a(b+c) = ab+ac, kausaalisuuden ja
stabiilisuuden tunnistus impulssivasteesta, jne.). Konvoluution
ominaisuuksien käsittelyn yhteydessä tuotiin esille niiden yhteys
LTI-järjestelmien yhdistämiseen: peräkkäiset tai rinnakkaiset
LTI-järjestelmät voidaan esittää yhtenä järjestelmänä ja toisaalta
niiden järjestys ei vaikuta lopputulokseen.
Kappaleen lopussa määriteltiin FIR- ja IIR-suotimet LTI-järjestelmien alalajeina. FIR-suotimet ovat yksinkertaisuutensa vuoksi laajemmin käytettyjä, mutta IIR-suodinten ilmaisuvoima ja laskennallinen tehokkuus tekevät niistä hyödyllisiä useissa tilanteissa.
Testikysymys: onko seuraava suodin FIR vai IIR?
y(n) = 0.9 y(n-1) - y(n-2) + x(n) + 0.5 x(n-1) +2 x(n-2)
Haastavampaa on selvittää esim. se, onko yo. suodin stabiili. Tähän ratkaisu löytyy prujun sivulta 68, johon pääsemme aikanaan.
Kappaleen lopussa määriteltiin FIR- ja IIR-suotimet LTI-järjestelmien alalajeina. FIR-suotimet ovat yksinkertaisuutensa vuoksi laajemmin käytettyjä, mutta IIR-suodinten ilmaisuvoima ja laskennallinen tehokkuus tekevät niistä hyödyllisiä useissa tilanteissa.
Testikysymys: onko seuraava suodin FIR vai IIR?
y(n) = 0.9 y(n-1) - y(n-2) + x(n) + 0.5 x(n-1) +2 x(n-2)
Haastavampaa on selvittää esim. se, onko yo. suodin stabiili. Tähän ratkaisu löytyy prujun sivulta 68, johon pääsemme aikanaan.
Toisella tunnilla päästiin kappaleeseen 3: Fourier-muunnos.
Olennaisin asia käsitteli muunnoksen ideaa alla olevan kuvan
mukaisesti. Fourier-muunnoksen idea on kysyä paljonko eri taajuuksia
annetussa signaalissa on. Taululla oli alla olevan piirroksen kaltainen
kuva. Kuvan "yhtälössä" vasemmalla oleva signaalin pätkä jaetaan eri
taajuuksiin kysymällä paljonko tarvitaan vakiotaajuutta (0.3 kpl),
paljonko kerran värähtävää siniä (0.6 kpl), jne. Sama idea on kaikkien
neljän muunnostyypin takana, mutta erona on montako eri taajuutta
tarvitaan muodostamaan alkuperäinen signaali. Joissain tapauksissa niitä
tarvitaan äärettömän paljon, jolloin kuvan summan sijaan tarvitaan
integraali.

Jatkuvat tapaukset perustuvat siis integraalin laskentaan, ja käytännössä tämä täytyy tehdä muunnostaulukoiden avulla.

Jatkuvat tapaukset perustuvat siis integraalin laskentaan, ja käytännössä tämä täytyy tehdä muunnostaulukoiden avulla.
Käsin laskettavien kolmen ensimmäisen muunnostyypin jälkeen tutustuttiin lopuksi diskreettiin Fourier-muunnokseen, joka voidaan esittää matriisimuunnoksena. Muunnosmatriisi muodostetaan lisäämällä rivi kerrallaan ykkösen n:nnen juuren eri
potensseja. Lopuksi esitettiin tällaisen matriisin konstruointi yksikköympyrän avulla tapaukselle N = 4.
keskiviikko 15. tammikuuta 2014
LTI-järjestelmät ja konvoluutio
Tänään käsiteltiin monisteen sivut 5-22. Ensimmäisena asiana vertailtiin
digitaalisia suotimia vastaaviin analogisiin suotimiin. Esimerkiksi
kurssilla opittava tietyn taajuuskaistan poistava suodin on mahdollista
toteuttaa myös analogisesti. Kysymys kuuluukin miksi sama pitäisi tehdä
digitaalisesti. Prujussa mainittujen lisäksi digitaalisuudesta on
(ainakin) kolme merkittävää etua:
- "Digitaalinen toiminnallisuus" tarkoittaa suomeksi softaa, jonka ainutkertainen ominaisuus on että saman tuotteen voi myydä useaan kertaan. Tästä syystä myös Bill Gates on maailman rikkain ihminen. Jos myyntimäärät ovat riittävän suuria, monimutkaisenkin softan toteutuksen hinta on mitätön suhteessa siitä saatavaan hyötyyn. Kannattaa siis hyvinkin palkata 10 DI:tä tekemään softalla ratkaisu, joka laskee lopputuotteen tuotantokustannusta esim. vain 10 senttiä, jos tuotetta myydään miljoonia kappaleita.
- Digitaalisuunnittelu on usein helpompaa kuin analogiasuunnittelu. SDSU:n kuuluisa professori frederick j. harris vertasi puheessaan työskentelyä digitaalisessa maailmassa työskentelyyn San Diegossa ja työtä analogisella puolella työhön Minnesotassa. San Diegossa on suunnilleen Välimeren ilmasto ja Minnesotassa suunnilleen Suomen ilmasto.
- Softatoteutus on joustavampi. Jos syystä tai toisesta tuotteen vaatiman suotimen vaatimukset muuttuvat, analogiatoteutukseen tilatut komponentit menevät romukoppaan. Digitaalisen suotimen tapauksessa käännetään softasta uusi versio ja aloitetaan tuotanto.

Kuvassa ylimpänä on suodatettava signaali, joka etenee vasemmalta oikealle. Jokaisen uuden näytteen saapuessa (kuvan ulkopuolelta vasemmalta) kerrotaan punaisella merkityt näytteet kuvan keskellä keskellä olevilla kertoimilla. Näin saadut tulot lasketaan yhteen ja sijoitetaan tulos alla olevan kuvan punaisella merkityksi uusimmaksi vastearvoksi.
Tämän jälkeen jatkettiin teoreettisemmalla asialla, eli kappaleen 2.2 diskreettien järjestelmien ominaisuuksilla. Näistä lineaarisuus ja aikainvarianssi ovat ne perusominaisuudet jotka otetaan myöhemmän tarkastelun lähtökohdaksi. Myös stabiilisuus on kriittinen ominaisuus, koska epästabiililla suotimella ei tee mitään.
Kappaleessa 2.3 tarkastellaan LTI-järjestelmiä, eli järjestelmiä jotka ovat lineaarisia ja aikainvariantteja. Kappaleen alussa osoitetaan, että LTI-järjestelmät voidaan esittää konvoluution avulla (josta on esimerkki yo. kuvassa). LTI-järjestelmän hieno ominaisuus on, että sen impulssivaste määrää vasteen mille tahansa herätteelle. Esimerkkinä tästä tutustuttiin demoon, jossa impulssivaste oli saatu lyömällä käsiä yhteen kirkossa (ts. generoimalla impulssi) ja mittaamalla vaste, josta kaiku oli selvästi kuultavissa. Näin saatua impulssivastetta voidaan käyttää mallina tilan akustisista ominaisuuksista, ja myös kotivahvistinten tilaefektit (hall, arena, club, jne.) on toteutettu tällä periaatteella. Mallia testattiin laskemalla konvoluutio seiska-testisignaalin ja kyseisen impulssivasteen kesken. Tulos kuulosti kuin testisignaali olisi viety kirkkoon.
Akustisen kaiun lisäksi toinen esimerkki konvoluution käytöstä reaalimaailman mallina voisi olla monitie-eteneminen tietoliikenteessä. Mielenkiintoisen tästä tekee se, että tämä ilmiö on mahdollista kompensoida ekvalisoinnilla, mikä käytännössäkin vähentää tietoliikenteessä syntyviä virheitä.
keskiviikko 8. tammikuuta 2014
Näytteenottoteoreema
Tänään
luennolla käsiteltiin kurssin hallinnolliset asiat sekä luentomonisteen
kappaleet 1.1 ja 1.2. Prujujen monistuksesta vastaa Tele-kilta, joka keräsi nimilistan monisteiden painamiseksi ensimmäisellä luennolla.
Toisella tunnilla varsinaista asiaa alustettiin puhumalla A/D-muunnoksesta, digitaalisista signaaleista, digitaalisista suotimis
ta sekä Fourier-muunnoksesta. Matlab-esimerkkinä tarkasteltiin erästä testisignaalia (seiska.wav) Matlabilla, ja todettiin, että oikealla olevassa spektrogrammissa näkyvät selvästi eri äänteet.
Ensimmäisenä varsinaisena asiana käsiteltiin näytteenottoteoreema, jonka mukaan naytteistämisessä ei häviä informaatiota, jos näytteenottotaajuus on vähintään tuplat signaalin korkeimpaan taajuuteen nähden. Käytännössä ennen näytteistystä täytyy siis poistaa liian korkeat taajuudet analogisella suotimella (kuten tämä) ettei laskostumista pääsisi tapahtumaan.
Audiossa tapahtuvaa laskostumista verrattiin videokuvaan, jossa esimerkiksi kärrynpyörä saattaa näyttää pyörivän väärään suuntaan. Youtubesta löytyy useita videoita hakusanalla Wagon wheel effect; esim. tämä. Sääntö on tässäkin tapauksessa sama: kuvia pitää ottaa vähintään kaksi per kierros.
Aikaisempina vuosina on muuten keskusteltu luennon jälkeen miksi live-tilanteessakin pyörät saattavat näyttää pyörivän väärään suuntaan tai miksi herkemmät ihmiset saattavat havaita loisteputkien värinän (loisteputkissa sähköverkon 50 Hz taajuus näkyy paljon selvemmin kuin hehkulampussa). Yksi tulkinta molemmista on että myös ihmisaivot toimivat tietyllä "kellotaajuudella", joka määrää sen minkä taajuiset ilmiöt voidaan havaita.
Näytteenottoteoreema liittyy myös peleissä käytettyyn ns. antialiasing-tekniikkaan. Myös tällöin lähtökohtana on äärettömän tarkka virtuaalinen malli, josta joudutaan ottamaan näytteitä esim. 1920 x 1200 monitoria varten. Tällöinkin kuvan sisältämät korkeat taajuudet laskostuvat ja muodostavat ns. Moire-ilmiön. Tästäkin päästään eroon suodattamalla signaali alipäästösuotimella ennen näytteistystä (eli poistamalla laskostuvat taajuudet).
Toisella tunnilla varsinaista asiaa alustettiin puhumalla A/D-muunnoksesta, digitaalisista signaaleista, digitaalisista suotimis
ta sekä Fourier-muunnoksesta. Matlab-esimerkkinä tarkasteltiin erästä testisignaalia (seiska.wav) Matlabilla, ja todettiin, että oikealla olevassa spektrogrammissa näkyvät selvästi eri äänteet.Ensimmäisenä varsinaisena asiana käsiteltiin näytteenottoteoreema, jonka mukaan naytteistämisessä ei häviä informaatiota, jos näytteenottotaajuus on vähintään tuplat signaalin korkeimpaan taajuuteen nähden. Käytännössä ennen näytteistystä täytyy siis poistaa liian korkeat taajuudet analogisella suotimella (kuten tämä) ettei laskostumista pääsisi tapahtumaan.
Audiossa tapahtuvaa laskostumista verrattiin videokuvaan, jossa esimerkiksi kärrynpyörä saattaa näyttää pyörivän väärään suuntaan. Youtubesta löytyy useita videoita hakusanalla Wagon wheel effect; esim. tämä. Sääntö on tässäkin tapauksessa sama: kuvia pitää ottaa vähintään kaksi per kierros.
Aikaisempina vuosina on muuten keskusteltu luennon jälkeen miksi live-tilanteessakin pyörät saattavat näyttää pyörivän väärään suuntaan tai miksi herkemmät ihmiset saattavat havaita loisteputkien värinän (loisteputkissa sähköverkon 50 Hz taajuus näkyy paljon selvemmin kuin hehkulampussa). Yksi tulkinta molemmista on että myös ihmisaivot toimivat tietyllä "kellotaajuudella", joka määrää sen minkä taajuiset ilmiöt voidaan havaita.
Näytteenottoteoreema liittyy myös peleissä käytettyyn ns. antialiasing-tekniikkaan. Myös tällöin lähtökohtana on äärettömän tarkka virtuaalinen malli, josta joudutaan ottamaan näytteitä esim. 1920 x 1200 monitoria varten. Tällöinkin kuvan sisältämät korkeat taajuudet laskostuvat ja muodostavat ns. Moire-ilmiön. Tästäkin päästään eroon suodattamalla signaali alipäästösuotimella ennen näytteistystä (eli poistamalla laskostuvat taajuudet).
Kurssiblogi perustettu
Kurssin SGN-11000 kurssiblogi on perustettu. Blogissa kirjataan jokaisen luennon jälkeen luennolla käydyt asiat lyhyesti. Lisäksi käsittelen blogissa luennolla tai sen jälkeen esiin nousseita kysymyksiä, luennolla käytyjä linkkejä, jne.
Pidän blogia, koska luentojen jälkeen ja sähköpostitse tulee hyviä kysymyksiä, joihin olisi kiva vastata. Lisäksi luennon asioiden lyhyt kirjaaminen päiväkirjaan helpottaa elämää niiden osalta, jotka eivät pääse luennolle. Kolmantena syynä on jatkuvasti pudonnut kurssipalautteen määrä. Toivottavasti tämä menettely lisää kommunikaatiota. Merkintöjen kommentointi on siis tervetullutta ja se onnistuu anonyymisti. Pyrin päivittämään blogin kerran viikossa luentojen jälkeen.
Pidän blogia, koska luentojen jälkeen ja sähköpostitse tulee hyviä kysymyksiä, joihin olisi kiva vastata. Lisäksi luennon asioiden lyhyt kirjaaminen päiväkirjaan helpottaa elämää niiden osalta, jotka eivät pääse luennolle. Kolmantena syynä on jatkuvasti pudonnut kurssipalautteen määrä. Toivottavasti tämä menettely lisää kommunikaatiota. Merkintöjen kommentointi on siis tervetullutta ja se onnistuu anonyymisti. Pyrin päivittämään blogin kerran viikossa luentojen jälkeen.
Tilaa:
Kommentit (Atom)