Untersuchung einer Interpolationsmethode für Videoaufnahmen zur
Transcription
Untersuchung einer Interpolationsmethode für Videoaufnahmen zur
Untersuchung einer Interpolationsmethode für Videoaufnahmen zur Erstellung von künstlichen Highspeed-Videos Studie durchgeführt von Dominik Hörner (2012) Am Institut für Sportwissenschaften der Universität Innsbruck Inhaltsverzeichnis 1 2 Einleitung ......................................................................................................................................... 4 1.1 Zielsetzung ............................................................................................................................... 5 1.2 Hypothese ............................................................................................................................... 6 Methode .......................................................................................................................................... 6 2.1 Verwendete Geräte ................................................................................................................. 6 2.1.1 Lukotronic ........................................................................................................................ 6 2.1.2 Casio Exilim F1 ................................................................................................................. 7 2.2 Verwendete Software ............................................................................................................. 7 2.2.1 After Effects ..................................................................................................................... 7 2.2.2 Twixtor ............................................................................................................................. 8 2.2.3 Virtual Dub....................................................................................................................... 8 2.2.4 AviSynth ........................................................................................................................... 8 2.2.5 Labview-Programm zur Digitalisierung ........................................................................... 9 2.2.6 Labview-Programm zur Interpolation ............................................................................. 9 2.2.7 Microsoft Excel 2010 ..................................................................................................... 10 2.3 Methodische Vorgehensweise .............................................................................................. 10 2.3.1 Twixtor Einstellungen .................................................................................................... 12 2.3.2 Statistische Auswertung ................................................................................................ 14 3 Ergebnisse...................................................................................................................................... 16 4 Diskussion ...................................................................................................................................... 18 4.1 5 Interpretation der Ergebnisse ............................................................................................... 18 4.1.1 Digitalisierung von Videos ............................................................................................. 18 4.1.2 Interpolationsmethoden ............................................................................................... 19 4.2 Kritikpunkte ........................................................................................................................... 21 4.3 Zusammenfassung ................................................................................................................. 22 Literaturverzeichnis ....................................................................................................................... 23 Abbildungsverzeichnis Abbildung 1: Lukotronic MCU 200 (www.lukotronic.com) ..................................................................... 6 Abbildung 2: Casio Exilim F1 (www.exilim.de) ........................................................................................ 7 Abbildung 3: Labview-Programm zur Digitalisierung .............................................................................. 9 Abbildung 4: Labview-Programm zur Interpolation .............................................................................. 10 Abbildung 5: Twixtor Einstellungen....................................................................................................... 12 Abbildung 6: Twixtor Ungenauigkeit ..................................................................................................... 13 Abbildung 7: Twixtor mit "Alt Motion Source" ..................................................................................... 14 Abbildung 8: Vergleich Lukotronic - Interpolationsmethoden.............................................................. 16 Abbildung 9: Vergleich Digi 300 - Twixtor 60 ........................................................................................ 17 Abbildung 10: Optische Verzerrung von Weitwinkelobjektiven (Quelle: Wikipedia/Ralf Roletschek) . 19 Tabellenverzeichnis Tabelle 1: Abweichungen Interpolationen - Lukotronic ........................................................................ 16 Tabelle 2: Abweichungen Interpolationen - Originalvideo ................................................................... 17 1 Einleitung Die Verletzungsprophylaxe stellt einen sehr wichtigen und weitreichenden Bereich innerhalb der Sportwissenschaften dar. Sowohl für Leistungs- als auch für Hobbysportler bedeutet eine schwere und langwierige Verletzung, dass es zu einem erheblichen Einschnitt in das alltägliche Leben und eventuell sogar zu einer existenziellen Bedrohung kommen kann. Ziel vieler Sportwissenschafter ist es deshalb, Verletzungsvorgänge und Verletzungsmechanismen so gut wie möglich zu analysieren, um daraus prophylaktische Maßnahmen abzuleiten, die dann in Trainingseinheiten und Technikleitbilder integriert werden können. Viele der „typischen“ Sportverletzungen sind mittlerweile gut untersucht und ihre biomechanischen Mechanismen klar. Jedoch speziell bei einer der häufigsten und langwierigsten Verletzungen im Sport, der Ruptur des vorderen Kreuzbandes, wird der Verletzungsmechanismus noch immer sehr kontrovers diskutiert. Aus diesem Grund sind in den vergangenen Jahren einige Studien verfasst worden, die mit modernsten Analysemethoden versucht haben dieser Thematik auf den Grund zu gehen. Das Hauptproblem besteht in diesem Feld darin, dass derartige Verletzungen selbstverständlich nicht kontrolliert im Labor reproduziert und untersucht werden können und man stattdessen auf Videoaufzeichnungen durch Trainer oder Fernsehen angewiesen ist. Diese Aufzeichnungen sind jedoch eher selten und weisen zusätzlich in den meisten Fällen nicht alle Qualitätsmerkmale für eine biomechanische Analyse auf (Bewegung in einer Ebene, Bildqualität, Synchronisation mehrerer Aufnahmen, hohe Brennweite, hohe Bildwiederholungsrate, usw.). Dennoch wurden, wie oben schon angesprochen, in den letzten Jahren sehr interessante Methoden entwickelt, um trotzdem möglichst viele kinematische Daten aus den vorhandenen Videoaufzeichnungen herauszuholen. So entwickelte zum Beispiel eine Forschergruppe des „Oslo Sports Trauma Research Center“ ein Verfahren, um anhand von synchronisierten Videoaufnahmen des Verletzungsherganges ein 3D Computermodell des Sportlers und seiner Umgebung zu erstellen. Damit gelang es zu wesentlich genaueren Daten bezüglich der vorhandenen Gelenkswinkel und vorherrschenden Kräfte als im Vergleich zu einer normalen Videoanalyse zu kommen (Krosshaug 2005 & 2007; Koga 2010). Eine große Schwachstelle stellt laut den Autoren jedoch noch immer die Berechnung von Bodenreaktionskräften dar: Die realen Belastungsspitzen lassen sich hierbei durch die relativ geringe zeitliche Auflösung von Fernsehaufnahmen (50 Hz bzw. 60 Hz.) nicht sehr gut bestimmen, da es sehr Seite | 4 leicht vorkommen kann, dass diese genau zwischen zwei aufgezeichneten Bildern liegen und der Maximalwert so nicht gemessen werden kann. „The estimates of the ground-reaction forces may also contain errors. They were calculated based on estimated accelerations of the center of mass, and the validation study has shown that estimates for acceleration are reasonably accurate (root mean square differences less than 6 m/s²). However, the relatively low frame rate in standard television broadcasts (50 Hz) makes it difficult to capture force peaks, and the true maximal force peak likely lies some time before the estimated maximum.“ (Koga 2010, Seite 2221-2222) Eine wesentlich genauere Analyse der Bodenreaktionskräfte und damit eine genauere Analyse des Verletzungsmechanismus wäre also möglich, wenn die Bildfrequenz der Ausgangsvideos höher wäre. 1.1 Zielsetzung Ziel dieser Studie ist es die Genauigkeit künstlich erstellter Highspeed-Videos anhand eines Vergleichs mit den Daten eines Infrarot-Marker-Systems, den Daten eines echten Highspeed-Videos und den Daten anderer Interpolationsmethoden zu überprüfen. Mit dem Begriff „künstlich erstellte Highspeed-Videos“ werden im Weiteren Videoaufnahmen bezeichnet, die von einer TV-üblichen Bildrate von 30 bzw. 60 Hertz mithilfe von After Effects (Adobe Systems Incorporated, San Jose, California, USA) und des Plugins Twixtor (RE:Vision Effects Inc., San Francisco, USA) auf eine Bildrate von 300 Hertz interpoliert werden. Das Plugin Twixtor stellt in der Unterhaltungsindustrie derzeit den Standard zum Erstellen von künstlichen Zeitlupenaufnahmen dar. Es verlangsamt und mischt nicht die bereits vorhandenen Bilder wie andere Verfahren, sondern berechnet die notwendigen fehlenden Bilder anhand der Veränderungen zwischen zwei aufeinanderfolgenden aufgenommenen Bildern neu. Mit „anderen Interpolationsmethoden“ wird hier die normalerweise zur Anwendung kommende Methode einer Spline-Interpolation von Datenreihen bezeichnet. Es werden hierbei also nicht die Videobilder selbst interpoliert, sondern die bereits digitalisierten Daten. Seite | 5 1.2 Hypothese Die mit Twixtor erstellten Highspeed-Videos liefern präzisere oder gleich präzise Daten wie die Spline-Interpolation der Daten aus normalen TV-Aufnahmen. 2 Methode 2.1 Verwendete Geräte 2.1.1 Lukotronic Abbildung 1: Lukotronic MCU 200 (www.lukotronic.com) Lukotronic ist ein Motion-Capture-System, das mithilfe von Infrarotmarkern Bewegungen in Echtzeit aufzeichnen kann. Abhängig von der jeweilig verwendeten Kameraeinheit ist eine unterschiedliche Messgenauigkeit und Aufnahmefrequenz möglich. Im Rahmen dieser Studie wurde das „Motion Capture Unit 200“ verwendet. Damit beträgt die maximale Messgenauigkeit des Systems 3 mm und die maximale Aufnahmefrequenz 300 Hertz. Alle technischen Daten des MCU 200 können unter folgendem Link nachgelesen werden: http://www.lukotronic.com/de/produkte/hardware/mcu-200.html Seite | 6 2.1.2 Casio Exilim F1 Abbildung 2: Casio Exilim F1 (www.exilim.de) Mithilfe dieser Digitalkamera können Highspeed-Videoaufnahmen mit verschiedenen Bildfrequenzen und Auflösungen aufgenommen werden. In dieser Studie wurde das Highspeed-Video, das später zur Analyse verwendet wurde, mit einer Bildfrequenz von 300 Bildern pro Sekunde aufgezeichnet. Die Auflösung betrug dabei 512 x 384 Pixel. Genaue technische Daten zur Kamera können hier nachgelesen werden: http://de.exilim.eu/de/exilimhighspeed/exf1/specifications/ 2.2 Verwendete Software 2.2.1 After Effects „After Effects CS5.5 ist die führende Lösung für eindrucksvolle Grafikanimationen und kinoreife visuelle Effekte, die Sie auf dem PC, auf der Leinwand, auf dem Fernseher oder auf mobilen Endgeräten präsentieren können.“ (http://www.adobe.com/de/products/aftereffects.html) In After Effects können Videos sehr vielseitig nachbearbeitet werden, weshalb dieses Programm auch für die Verwendung des unten beschriebenen Plugins Twixtor empfohlen wird. Seite | 7 2.2.2 Twixtor Twixtor ist ein Multi-Plattform Plugin, mit dem Videos sehr einfach und schnell beschleunigt oder verlangsamt werden können. Es berechnet und erstellt dabei die benötigten Bilder künstlich neu, wodurch sehr wirklichkeitsgetreue Zeitraffer- und Zeitlupenaufnahmen erzeugt werden können. „Twixtor enables you to speed up, slow down or frame rate convert your image sequences with visually stunning results. In order to achieve its unparalleled image quality, Twixtor synthesizes unique new frames by warping and interpolating frames of the original sequence... employing RE:Vision's proprietary tracking technology that calculates motion for each individual pixel.“ (http://www.revisionfx.com/products/twixtor/overview/) 2.2.3 Virtual Dub „Virtual Dub is a video capture/processing utility for 32-bit and 64-bit Windows platforms.“ „It lacks the editing power of a general-purpose editor such as Adobe Premiere, but is streamlined for fast linear operations over video.“ (http://www.virtualdub.org/) Es handelt sich hierbei also um ein einfach gestaltetes Videobearbeitungsprogramm, mit dem sehr simpel und schnell grundlegende Editierungsschritte durchgeführt werden können. 2.2.4 AviSynth „AviSynth fungiert als Frameserver, welcher Dateien einliest, und den Datenstrom an ein anderes Programm mittels einer virtuellen Datei weiterreicht. Wird eine AVS-Skript-Datei mit einem unterstützenden Videobearbeitungsprogramm (beispielsweise Virtual Dub) geöffnet, so verhält sich diese dem Zielprogramm gegenüber wie eine AVI-Datei, welche eine rohe Video- und Audiospur beinhalten würde. Auf diese Weise können auch Formate geöffnet werden, welche vom Zielprogramm nicht unterstützt werden- oder vorher die Installation eines Codecs benötigen würden.“ (http://de.wikipedia.org/wiki/AviSynth) Seite | 8 2.2.5 Labview-Programm zur Digitalisierung Zur Digitalisierung der Videos wurde ein auf der Universität Innsbruck entwickeltes LabviewProgramm benutzt, welches das in Labview integrierte „optical flow“ VI verwendete. Das Hauptmerkmal dieses Programmes war, dass der zu analysierende Punkt zu Beginn einmal markiert wurde und das Programm ihn über die gesamte Bildreihe automatisch weiter verfolgte. Abbildung 3: Labview-Programm zur Digitalisierung Die korrekte Digitalisierung wurde anhand einer visuellen Beurteilung durch den Studienleiter sichergestellt und wenn nötig mehrere Male wiederholt, bis die bestmögliche Verfolgung des Punktes gegeben war. 2.2.6 Labview-Programm zur Interpolation Um die Datenreihen nach der Digitalisierung zu interpolieren, wurde ein an der Universität Innsbruck entwickeltes Labview-Programm verwendet. Die Interpolation erfolgte mittels kubischem Spline und der Interpolationsfaktor konnte frei gewählt werden. Seite | 9 Abbildung 4: Labview-Programm zur Interpolation 2.2.7 Microsoft Excel 2010 Die statistische und graphische Auswertung der Daten wurde mit Excel 2010 durchgeführt 2.3 Methodische Vorgehensweise Um Interpolationsmethoden validieren zu können, müssen sie mit einem möglichst realitätsnahen Referenzmaterial verglichen werden. Um dies zu bewerkstelligen wurde zu Beginn der Studie eine Highspeed-Videoaufnahme von einem Drop-Jump aus ca. 50 cm Höhe mit einer Casio Exilim F1 Kamera aufgenommen. Gleichzeitig wurden die Bewegungsdaten des beobachteten Punktes mittels Lukotronic Motion-Capture-System aufgezeichnet. Der beobachtete Punkt befand sich im Bereich des Fersenbeins und wurde durch einen Infrarot-Marker definiert (siehe Abbildungen 3, 6 & 7). Die Bildfrequenz der Videoaufnahme betrug 300 Bilder pro Sekunde, da dadurch noch immer eine relativ gute Auflösung von 512 x 384 Pixel erreicht wurde. Zusätzlich musste die Aufnahmefrequenz von Lukotronic an die Aufnahmefrequenz des Videos angepasst werden, wodurch sich eine weitere Limitierung auf 300 Hertz ergab, da dies die maximale Aufnahmefrequenz des verwendeten MCU 200 Seite | 10 darstellt. Die Shutter-Geschwindigkeit der Videoaufnahme betrug 1/600, damit es nur zu einer möglichst geringen Bewegungsunschärfe kam. Nach der oben beschriebenen Videoaufnahme wurde das Videomaterial nun weiter bearbeitet, um für Fernsehaufnahmen im NTSC-Format typische Bildfrequenzen im Bereich von 30 bzw. 60 Hertz zu bekommen. Dazu wurde das Originalvideo mithilfe von AviSynth in Virtual Dub importiert und mit der Funktion „Frame Rate“ von 300 Bildern pro Sekunde auf 60 bzw. 30 Bilder pro Sekunde reduziert. Die daraus entstandenen Videos wurden als erstes in ein an der Sportuniversität Innsbruck entwickeltes Labview-Programm zum Digitalisieren von Videoaufnahmen importiert und die daraus resultierenden Daten der Vertikalbewegung des analysierten Punktes gespeichert. Diese Bewegungsdaten wurden in ein zweites Labview-Programm zur Interpolation importiert und damit wieder von 30 bzw. 60 Hertz auf 300 Hertz interpoliert. Diese Datenreihen wurden im Weiteren als Interpolation 30 und Interpolation 60 bezeichnet. Als zweites wurden die 30 bzw. 60 Hertz Videos in After Effects importiert und mithilfe des TwixtorPlugins wieder auf 300 Hertz interpoliert. Danach wurden auch diese interpolierten Videos mit dem vorher erwähnten Labview-Programm digitalisiert und die daraus entstandenen Datenreihen der Vertikalbewegung des analysierten Punktes im Weiteren als Twixtor 30 und Twixtor 60 bezeichnet. In weiterer Folge wurden als erstes die Daten der verschiedenen Interpolationsmethoden mit den Lukotronic-Bewegungsdaten (Luko) verglichen, da angenommen werden kann, dass die maximale Messgenauigkeit von 3 mm des Lukotronic-Systems die Genauigkeit der digitalisierten Daten des aufgenommen Highspeed-Videos übersteigt. Zusätzlich wurden auch die Daten des aufgenommenen Highspeed-Videos mit den Lukotronic-Daten verglichen, um prinzipiell den zu erwartenden Fehler durch eine Digitalisierung von Videoaufnahmen abschätzen zu können. Als zweites wurden die Daten der verschiedenen Interpolationsmethoden mit den Daten des aufgenommenen Highspeed-Videos verglichen. Dadurch, dass alle Datenreihen in dieser Gegenüberstellung mit demselben Digitalisierungsvorgang erstellt wurden, lässt sich der dabei auftretende Fehler vernachlässigen und eine genauere Beurteilung der Arbeitsweise der unterschiedlichen Interpolationsmethoden wird möglich. Seite | 11 2.3.1 Twixtor Einstellungen Das 30 bzw. 60 Hertz Video wurde in After Effects in eine neue Komposition eingefügt, die den Bildmaßen des Videos entsprach und eine Länge von 637 Bildern hatte. Diese spezifische Länge wurde deshalb ausgewählt, da das die genaue Bildanzahl des Originalvideos war. In den Einstellungen des Twixtor-Plugins wurden folgende Werte gesetzt: Abbildung 5: Twixtor Einstellungen Input Framerate: 30 bzw. 60 Bilder pro Sekunde Motion Vectors: Best Image Prep: Contrast/Edge Enhance Motion Sensitivity: 70 Time Remap Mode: Frame Number Frame Interp: Motion Weighted Blend Smart Blend: On Alt Motion Source: Bei der Interpolation des 60 Hertz Videos: Off Bei der Interpolation des 30 Hertz Videos: On Seite | 12 Der „Time Remap Mode“ wurde auf die Einstellung „Frame Number“ gesetzt, um eine absolut exakte Interpolation auf insgesamt 637 Bilder zu bekommen. Das 30 Hertz Video bestand nur aus 63 Bildern und das 60 Hertz Video nur aus 127 Bildern, daher mussten diese auf die ganze Länge von 637 Bildern verteilt werden, damit das Plugin die fehlenden Zwischenbilder wieder neu berechnete. Das wurde damit erreicht, dass im ersten Frame der Komposition die Framenummer 0 des 30 bzw. 60 Hertz Videos per Keyframe definiert wurde. Im letzten Frame der Komposition wurde selbiges mit Framenummer 63 des 30 Hertz Videos und Framenummer 127 des 60 Hertz Videos gemacht. Somit interpolierte das Plugin alle fehlenden Zwischenbilder und die Endlänge des Videos betrug wieder genau 637 Bilder. Eine unterschiedliche Einstellung bei „Alt Motion Source“ wurde bei der Interpolation des 30 Hertz Videos deswegen gewählt, weil Twixtor speziell im Bereich des ersten Bodenkontaktes des Fußes große Probleme mit der korrekten Interpolation des Videos hatte. Abbildung 6: Twixtor Ungenauigkeit Twixtor bietet in diesem Fall eine Möglichkeit an, um bessere Bewegungsvektoren der Pixel berechnen zu können und somit Ungenauigkeiten wie in Abbildung 3 zu verhindern. Dabei bedient sich das Plugin folgenden Tricks: Man kann die Bewegungsvektoren statt über die „normale“ Version des 30 Hertz Videos über eine alternative Version des gleichen Videos berechnen. In dieser alternativen Version kann man Kontrast und Helligkeit des Videos so stark verändern, dass man möglichst exakte und scharfe Kanten der Objekte bekommt, auch wenn die Farben des Bildes Seite | 13 dabei schon sehr stark verzerrt werden. Damit kann das Plugin genauere Bewegungsvektoren berechnen und diese dann für die Interpolation des „normalen“ 30 Hertz Videos verwenden. Abbildung 7: Twixtor mit "Alt Motion Source" Damit konnte eine wesentliche Verbesserung der Interpolation erzeugt werden und die Bildqualität entsprach damit den Voraussetzungen für eine spätere Digitalisierung. 2.3.2 Statistische Auswertung Um einen Vergleich aller ermittelten Datenreihen durchführen zu können, mussten diese zeitlich als auch räumlich synchronisiert werden. Dazu wurde als erstes ein Punkt bestimmt, anhand dessen alle Datenreihen angeglichen wurden. Die Wahl fiel dabei auf den niedrigsten Punkt während des ersten Bodenkontaktes, da diese Richtungsänderung die schnellste und kürzeste der Sequenz war und daher die Messfehler der diversen Methoden den Zeitpunkt dieses Wertes relativ wenig beeinflussten. Als erstes wurde also der Nullpunkt jeder Datenreihe in oben genannten Punkt gesetzt. Dazu wurde der niedrigste Wert während des ersten Bodenkontaktes aus jeder Datenreihe herausgesucht und damit der nötige Versatz berechnet. Seite | 14 Danach wurde der Zeitpunkt des oben genannten Punktes innerhalb der Lukotronic-Datenreihe bestimmt und die Nullpunkte aller anderen Datenreihen, wenn nötig, zeitlich angeglichen. Dies wurde unter anderem deswegen notwendig, da z.B. das Programm zum Digitalisieren der Videos keine Koordinaten für das letzte Bild ausgab und daher nach der Interpolation einmal 5 und einmal 10 Werte zu wenig ausgegeben wurden. Da die Frequenz jedoch trotzdem die gleiche war, konnte dieses Problem durch ein einfaches zeitliches angleichen, wie oben beschrieben, gelöst werden. Als nächstes wurden alle Datenreihen auf einen Zeitpunkt kurz vor der Landung (dem zweiten Bodenkontakt) gekürzt, da es in der Datenreihe Twixtor 30 gegen Ende zu relativ großen Ungenauigkeiten beim Digitalisieren kam. Um also eine mögliche Verfälschung der Vergleiche zu verhindern, wurden nur jene Werte bis zum „Verlust“ des zu digitalisierenden Punktes einbezogen. Ein ähnliches Problem trat bei den beiden Datenreihen Interpolation 30 bzw. 60 auf. Die SplineInterpolation lieferte zu Beginn der Datenreihen sehr stark vom Original abweichende Ergebnisse, wodurch auch hier mit dem Ziel eines fairen Vergleiches vom Studienleiter beschlossen wurde, die Datenreihen bis zum Beginn der Abwärtsbewegung zu kürzen. Aus den so gesammelten Daten der Vertikalbewegung des analysierten Punktes wurden in Excel die maximale Abweichung des Weges in Zentimeter und Prozent, die mittlere Abweichung in Zentimeter und Prozent und der mittlere quadratische Fehler (Root Mean Square Deviation - RMSD) im Vergleich zu den Lukotronic-Daten und den Daten des aufgenommenen Highspeed-Videos berechnet. Seite | 15 3 Ergebnisse Vergleich Lukotronic - Interpolationsmethoden Gesamte Sequenz 60,00 Weg [cm] 50,00 40,00 Lukotronic Digi 300 30,00 Interpolation 30 20,00 Interpolation 60 Twixtor 30 10,00 Twixtor 60 0,00 0,0 0,1 0,2 0,3 0,4 0,6 0,7 0,8 0,9 Zeit [s] Abbildung 8: Vergleich Lukotronic - Interpolationsmethoden Wie aus Abbildung 8 und Tabelle 1 zu erkennen ist, war die allgemeine Abweichung der Interpolationsmethoden zu Lukotronic relativ gering. Die größten Abweichungen traten generell an den oberen Wendepunkten auf. Hier wurden Abweichungen von maximal 5,26 Zentimetern bzw. 10,28% des gesamten Bewegungsraumes von Lukotronic gemessen. Tabelle 1: Abweichungen Interpolationen - Lukotronic Max. Abweichung [cm] Max. Abweichung % MW Abweichung [cm] MW Abweichung % RMSD [cm] Interp 60-Luko 5,26 10,28 2,16 4,23 2,505 Twixtor 30-Luko 4,27 8,35 1,98 3,87 2,312 Interp 30-Luko 4,14 8,09 1,78 3,48 2,043 Digi 300-Luko 3,47 6,79 1,45 2,84 1,779 Twixtor 60-Luko 3,31 6,47 1,44 2,81 1,773 Vergleich Die größten Abweichungen zu Lukotronic traten in der Datenreihe Interpolation 60 auf, die niedrigsten Abweichungen in der Datenreihe Twixtor 60. Die Daten des Originalvideos (Digi 300) wiesen mit einer maximalen Abweichung von 3,47 cm und einem mittleren quadratischen Fehler (RMSD) von 1,779 cm eine geringfügig größere Abweichung auf als die Datenreihe Twixtor 60. Seite | 16 Tabelle 2: Abweichungen Interpolationen - Originalvideo Vergleich Max. Abweichung Max. Abweichung [cm] % MW Abweichung [cm] MW Abweichung % RMSD [cm] Twixtor 30-Digi 300 4,16 8,13 1,88 3,68 2,251 Interp 60-Digi 300 1,91 3,74 0,91 1,78 1,074 Interp 30-Digi 300 1,53 2,99 0,73 1,43 0,856 Twixtor 60-Digi 300 0,62 1,22 0,25 0,50 0,315 Ein Vergleich zwischen den Daten des Originalvideos und den Interpolationsmethoden (Tabelle 2) zeigte ein ähnliches Ergebnis. Die größten Unterschiede zeigte hier die Datenreihe Twixtor 30, die geringsten Unterschiede wies weiterhin die Datenreihe Twixtor 60 auf. Wie exakt Twixtor das 60 Hertz Video auf 300 Hertz interpolierte zeigt Abbildung 9. Vergleich Digi 300 - Twixtor 60 60,00 50,00 Weg [cm] 40,00 30,00 Digi 300 Twixtor 60 20,00 10,00 0,00 0,0 0,1 0,2 0,3 0,4 0,6 0,7 0,8 0,9 Zeit [s] Abbildung 9: Vergleich Digi 300 - Twixtor 60 Seite | 17 4 Diskussion 4.1 Interpretation der Ergebnisse 4.1.1 Digitalisierung von Videos Generell konnte in dieser Studie gezeigt werden, dass die Digitalisierung von Videos eine durchaus valide und reliable Methode ist um kinematische Daten aus Videoaufnahmen abzuleiten. Mit einem mittleren quadratischen Fehler von 1,779 cm liegt die Messgenauigkeit dieser Methode in einem sehr akzeptablen Bereich. Zusätzlich könnte die Genauigkeit durch eine größere Auflösung des Videomaterials mit Sicherheit noch verbessert werden, da die in dieser Studie verwendete Auflösung von 512 x 384 Pixel im Vergleich zu der Auflösung von HD-Fernsehaufnahmen (1920 x 1080 bzw. 1280 x 720 Pixel) sehr gering ist. Interessant ist die Tatsache, dass die größten Abweichungen immer an den oberen Wendepunkten zustanden kamen. Dies könnte auf eine optische Verzerrung des Videomaterials durch das Objektiv der Kamera zurückzuführen sein. Um eine möglichst geringe Verzerrung zu erhalten, sollte beim Aufnehmen von Videos an der Kamera immer der größtmögliche optische Zoomfaktor (höchste Brennweite) verwendet werden. Bei den Aufnahmen für diese Studie war dies leider nicht möglich, da alle Videos in einem Laborraum mit begrenztem Platz aufgezeichnet wurden und daher nur die Hälfte des möglichen Zoombereichs verwendet werden konnte. Die daraus vermutlich entstandenen Verzerrungen wirken sich besonders im Randbereich des Videos aus, da durch den typischen „Weitwinkeleffekt“ (siehe Abbildung 10) Bewegungen am Bildrand nicht mehr so starke Pixelbewegungen hervorrufen wie in der Bildmitte. Seite | 18 Abbildung 10: Optische Verzerrung von Weitwinkelobjektiven (Quelle: Wikipedia/Ralf Roletschek) Aus diesem Grund kann angenommen werden, dass der Bewegungsbereich aller digitalisierten Aufnahmen, aufgrund von leichten optischen Verzerrungen im Randbereich, nicht so groß war wie jener von Lukotronic. 4.1.2 Interpolationsmethoden Die Ergebnisse der verschiedenen Interpolationsmethoden waren durchaus ein wenig überraschend. Prinzipiell kann eigentlich davon ausgegangen werden, dass eine Interpolationsmethode besser arbeiten kann, wenn sie nur von 60 auf 300 Hertz interpolieren muss und nicht von 30 auf 300 Hertz. Insofern ist es ein wenig verwunderlich, dass die Spline-Interpolation der 30 Hertz Daten näher an den Daten von Lukotronic bzw. des Originalvideos liegt als die der 60 Hertz Daten. Bei der Digitalisierung aller Videos wurde zwar sehr stark auf eine exakte Bestimmung des untersuchten Punktes geachtet, kleine Abweichungen zwischen den verschiedenen Videos sind aber selbstverständlich nie auszuschließen. Eventuell sind die schlechteren Ergebnisse der 60 Hertz Interpolation also auf größere Ungenauigkeiten bei der Digitalisierung zurückzuführen. Seite | 19 Die Arbeitsweise des Twixtor-Plugins scheint nach Betrachtung der Ergebnisse sehr stark von der Bildrate des Ausgangsmaterials abzuhängen. Während bei der Interpolation des Videos von 60 auf 300 Bilder pro Sekunde die genaueste Interpolation aller Methoden zustande kam und auch keine speziellen Einstellungen im Plugin vorgenommen werden mussten, so kam es bei der Interpolation des Videos mit 30 Bildern pro Sekunde doch zu erheblich größeren Problemen. Als erstes musste, wie schon im Kapitel „Methodische Vorgehensweise“ erwähnt wurde, eine alternative Version des Videos zur Berechnung der Bewegungsvektoren verwendet werden, um überhaupt ein brauchbares interpoliertes Video zu erhalten. Doch selbst dann wichen die berechneten Bilder deutlich stärker vom Originalvideo ab als jene des Ausgangsmateriales mit 60 Bildern pro Sekunde. Sehr überraschend war jedoch, dass ein mit Twixtor von 60 auf 300 Bilder pro Sekunde interpoliertes Video fast identisch mit einem originalaufgenommenen Highspeed-Video ist. Der mittlere quadratische Fehler von 0,315 cm bestätigt, dass es lediglich zu minimalsten Abweichungen bei der Interpolation bzw. der Digitalisierung kam. Dieses Ergebnis zeigt also, dass aus Fernsehaufnahmen mit 60 und eventuell 50 Bildern pro Sekunde äußerst realistische Highspeed-Aufnahmen erzeugt und somit Bodenreaktionskräfte oder andere kinematische Daten vermutlich deutlich genauer berechnet werden können. Die große Frage die sich nun stellt ist natürlich, warum das Twixtor-Plugin anscheinend bessere Interpolationen liefert als Spline-Interpolationen. Die Antwort darauf kann ohne genaue Kenntnisse über die Arbeitsweise von Twixtor vermutlich nicht gegeben werden. Diese ist jedoch verständlicherweise ein gut gehütetes Geheimnis der Firma „RE:Vision Effects“, welche derzeit durch ihr Produkt Twixtor im Grunde genommen eine Monopolstellung in diesem Sektor genießt. Was man aus der aus Kapitel 2 angeführten offiziellen Beschreibung von Twixtor jedoch herauslesen kann ist, dass in jedem Videobild die Bewegungsvektoren jedes einzelnen Pixels berechnet werden. Dadurch könnte man annehmen, dass sich die Vektoren benachbarter bzw. naheliegender Pixel gegenseitig beeinflussen, um eine möglichst korrekte Bewegungsvorhersage zu erstellen. Somit würde der Bewegungsvektor eines einzelnen Pixels eigentlich aus mehreren Vektoren berechnet werden. Im Vergleich dazu entstehen die Daten einer Spline-Interpolation immer nur anhand des Bewegungsvektors eines einzelnen Punktes, da bei der Digitalisierung eines Videos ja nicht die Bewegungsdaten jedes einzelnen Punktes, sondern nur die des ausgewählten Punktes, gespeichert werden. Hier könnte also eventuell der Grund für eine bessere Interpolation von Twixtor liegen. Seite | 20 4.2 Kritikpunkte Eine gewisse Ungenauigkeit bei der Durchführung dieser Studie entstand aus der Tatsache, dass die zur Analyse und weiteren Bearbeitung ausgewählte Videosequenz aus 637 Bildern bestand. Um diese Sequenz auf 60 bzw. 30 Bilder pro Sekunde zu reduzieren, musste die Bildanzahl um den Faktor 5 bzw. 10 reduziert werden. Die daraus resultierenden Bildanzahlen für die neuen Sequenzen wären demnach 127,4 bzw. 63,7 Bilder gewesen. Da die Kommastellen bei der Reduktion der Bildanzahl natürlich wegfielen, entsprachen die tatsächlichen Reduktionsfaktoren der Videos 5,01 bzw. 10,11. Die Bildanzahl der Videos wurde tatsächlich also noch ein wenig stärker reduziert als ursprünglich geplant. Die praktischen Auswirkungen hielten sich jedoch stark in Grenzen. Die entstandenen Videosequenzen hatten nämlich die gewünschten Bildraten von 30 bzw. 60 Bildern pro Sekunde, endeten aber mit dem Bild Nummer 635 bzw. 630 des Originalvideos (Virtual Dub wählte jedes fünfte bzw. zehnte Bild beginnend mit Bildnummer 0 aus). Da zur späteren Auswertung sowieso einige Daten zu Beginn und am Ende der Sequenz weggeschnitten wurden, fiel diese Tatsache bei der Spline-Interpolation nicht ins Gewicht. Bei der Erstellung der von Twixtor interpolierten Videos ergab sich aber sehr wohl eine geringe Beeinflussung. Durch die Dehnung der Videos auf 637 Bilder wurden bei der Interpolation des 60 Hertz Videos in etwa 2 zusätzliche Bilder mehr eingefügt, bei der Interpolation des 30 Hertz Videos in etwa 7 Bilder mehr. Durch die Verkürzung der Datenreihen während der Auswertung ist die tatsächliche Anzahl der zusätzlichen Bilder in den Daten noch geringer. Es ist demnach nicht anzunehmen, dass eine bedeutende Beeinflussung der Ergebnisse entstanden ist. Wie schon erwähnt wurde während der Aufnahme des verwendeten Videos eine zu geringe Brennweite verwendet, wodurch es vermutlich zu leichten optischen Verzerrungen besonders im Randbereich des Bildes kam. Diese Verzerrungen beeinflussen zwar den Vergleich der digitalisierten Daten mit den Daten von Lukotronic, nicht jedoch den Vergleich zwischen den einzelnen Interpolationsmethoden. Aus diesem Grund dürfte auch hier keine nennenswerte Beeinflussung der Ergebnisse entstanden sein. Des Weiteren kann als Kritikpunkt angeführt werden, dass die Digitalisierung der Videos nach einmaligem Markieren des zu analysierenden Punktes völlig automatisch ablief. Hätte die Möglichkeit bestanden in diesen Prozess einzugreifen, hätten vermutlich durch die händischen Korrekturen noch genauere Bewegungsdaten erhoben werden können. Auf der anderen Seite ist durch eine automatische Digitalisierung eine wesentlich größere Reliabilität gegeben und eventuelle Seite | 21 Verzerrungen durch die Erwartungshaltung des Studienleiters konnten von vorn herein vermieden werden. Zuletzt sollte noch festgehalten werden, dass diese Studie lediglich an einer einzigen Videosequenz durchgeführt wurde und die Ergebnisse daher nur limitierte Aussagekraft besitzen. Zum einen wurden die Aufnahmen so durchgeführt, dass sie sich möglichst gut für diese Untersuchung eigneten, zum anderen wurde auch eine möglichst gut analysierbare Bewegung in Form eines Drop-Jumps gewählt. Es ist also fraglich, inwieweit die Ergebnisse dieser Studie auf andere Videoaufnahmen bzw. Sportbewegungen übertragbar sind. 4.3 Zusammenfassung Mithilfe des Twixtor-Plugins können Videoaufnahmen mit 60 Bildern pro Sekunde äußerst genau auf höhere Bildfrequenzen interpoliert werden. Diese Methode scheint sogar den bisher verwendeten Spline-Interpolationen der bereits digitalisierten Daten überlegen zu sein. Ein Ausgangsvideo mit 30 Bildern pro Sekunde liefert jedoch schon wesentlich weniger präzise Interpolationen. Durch Twixtor besteht also eine sehr einfache und schnelle Möglichkeit normale Fernsehaufnahmen in Highspeed-Videos umzuwandeln, um bei einer biomechanischen Analyse genauere kinematische Daten zu erhalten. Da solche Analyseverfahren in der Regel selbst schon sehr viel Zeit in Anspruch nehmen, würde der im Vergleich dazu geringe Zeitaufwand zur Verbesserung des Videomaterials zu keiner wesentliche Erhöhung des gesamten Arbeitspensums führen. Fraglich bleibt dabei allerdings, wie gut das Plugin mit den Bildern von Fernsehkameras umgehen kann. Um eine präzise Arbeitsweise zu gewährleisten, sollten die Bilder des Ausgangsmateriales möglichst scharf sein. Bei einer Aufnahme mit 60 Bildern pro Sekunde beträgt die Verschlusszeit der Videokamera in der Regel 1/120 Sekunde. Bei solchen Verschlusszeiten kommt es gerade bei Sportaufnahmen sehr schnell zu Unschärfen durch schnelle Bewegungen der Sportler, was die Ergebnisse einer Interpolation mit Twixtor negativ beeinflussen kann. Weitere praktische Versuche zur Anwendbarkeit und Genauigkeit in unterschiedlichen Situationen sind also notwendig, um die in dieser Studie vorgestellte Methode zur optischen Interpolation von Videoaufnahmen eventuell als Standard im sportwissenschaftlichen Arbeiten zu integrieren. Seite | 22 5 Literaturverzeichnis Koga, H.; Nakamae, A.; Shima, Y.; Iwasa, J.; Myklebust, G.; Engebretsen, L. et al. (2010): Mechanisms for Noncontact Anterior Cruciate Ligament Injuries: Knee Joint Kinematics in 10 Injury Situations From Female Team Handball and Basketball. In: The American Journal of Sports Medicine 38 (11), S. 2218–2225, Krosshaug, Tron; Bahr, Roald (2005): A model-based image-matching technique for threedimensional reconstruction of human motion from uncalibrated video sequences. In: Journal of Biomechanics 38 (4), S. 919–929, Krosshaug, T.; Slauterbeck, J. R.; Engebretsen, L.; Bahr, R. (2007): Biomechanical analysis of anterior cruciate ligament injury mechanisms: three-dimensional motion reconstruction from video sequences. In: Scandinavian Journal of Medicine & Science in Sports 17 (5), S. 508–519, Internetquellen: Technische Daten Lukotronic MCU 200 (http://www.lukotronic.com/de/produkte/hardware/mcu200.html); Zugriff am 01.01.2012 Technische Daten Casio Exilim F1 (http://de.exilim.eu/de/exilimhighspeed/exf1/specifications/); Zugriff am 01.01.2012 Beschreibung Twixtor (http://www.revisionfx.com/products/twixtor/overview/); Zugriff am 02.01.2012 Beschreibung Virtual Dub (http://www.virtualdub.org/); Zugriff am 02.01.2012 Beschreibung AVI-Synth (http://de.wikipedia.org/wiki/AviSynth); Zugriff am 02.01.2012 Seite | 23