Secondary Adv

Kjo teknologji e re lejon redaktimin e zerit ashtu si tekstin

Share on Google+

Inxhinierët e Universitetit Princeton kanë zhvilluar ‘Photoshop-in’ për redaktimin e audios. Ky softuer i ri mund të shtojë fjalë ose ti zëvendësojë ato në regjistrimin audio të një zëri njerëzor.

 

Për vite me rradhë inxhinierët e audios kanë qenë në gjendje të heqin pjesë duke redaktuar transkriptimin e klipit. Megjithatë, ata kurrë nuk kanë qenë në gjendje të shtojnë ose të zëvendësojnë një fjalë për hir të qartësisë. Ky softuer i ri, i quajtur  VoCo,  sintetizon fjalët e reja në zërin e folësit me lehtësi, edhe nëse kjo fjalë nuk shfaqet askund tjetër në regjistrim.

"VoCo automatizon procesin e kërkimit dhe rregullimit, dhe prodhon rezultate që janë edhe më të mira se ato të krijuara manualisht nga ekspertët e audios”, tha Adam Finkelstein. Finkelstein është profesor i shkencave kompjuterike në Princeton.

Softueri përdor një algoritëm që skanon regjistrimin në tërësi dhe bashkon një kombinim të tingujve të fjalëve. Këta tinguj, të quajtur fonemë, kulmojnë me fjalën e re në zërin origjinal. Algoritmi madje mundëson edh vendosjen e fjalës në një fjali. Ai merr parasysh kontekstin e fjalës dhe shton theksin e duhur.

“VoCo ofron zhvillimin e një teknologjie shumë praktike për redaktimin e gjurmëve audio, por gjithashtu është një shenjë paralajmëruese për teknologjitë e ardhshme që do të lejojnë që zëri njerëzor të sintetizohet dhe automatizohet në mënyra të jashtëzakonshme”, tha Finkelstein.


Më të lexuarat