| Line 53: | Line 53: | ||
| File:Optical Flow_Bee_02.png | File:Optical Flow_Bee_02.png | ||
| File:Optical Flow_Bee_03.png | File:Optical Flow_Bee_03.png | ||
| File: | File:Convolutionlayer_Bee.png | ||
| File: | File:Convolutionlayer_Deer.png | ||
| File: | File:Convolutionlayer_Fieldmouse.png | ||
| </gallery> | |||
| </gallery> | </gallery> | ||
Revision as of 17:54, 8 November 2022
MFA Thesis Project Alternate A(animal) I(intelligence)
Research and Production
Konzept
Filming
Post-Production (Teil 1) Bearbeitung der Filmaufnahmen / Editing Film-footage'
Die Postproduktion des Film stellt sich aus verschiedenen Aufgabenbereichen zusammen. Die Bearbeitung der Filmaufnahmen beinhaltet zum einen das 'Compositing', sprich das Zusammenfügen der zwei Kameraperspektiven zu einem nahtlosen Gesamtbild. Zum anderen wird durch VFX ('Visual Effects') das Filmmaterial basieren auf der Recherchearbeit zur Biologie der jeweiligen Tiere künstlerisch aufbereitet. Die Recherche dient hierbei immer als Informationsquelle/Richtwert, welcher dann in Videoeffekte uminterpretiert wird.
Für diese Aufgabenbereiche worden jeweils eine weiter Person/Kollaborateur an Board geholt, welche mittels Briefing-Dokumenten, Gesprächen, gemeinsamen Arbeitssessions und Feedbackrunden angeleitet werden.
//
The post-production of the film consists of various tasks. The editing of the film footage includes compositing, i.e. the merging of the two camera perspectives into one seamless image. On the other hand, VFX ('Visual Effects') is used to further edit and enhance the film material based on the research of the biology of the respective animals. The research always serves as a source of information/reference, which is then reinterpreted into video effects.
For each of these tasks another person/collaborator was brought on board, who is guided by briefing documents, conversations, joint work sessions and feedback rounds.
Post-Produktion (Teil 2) Visualisierung der KI / Visualising the AI
</gallery>
Visualisation Stage 2 - Using ANNs for break-down of computer vision
Visualisation Stage 2 - Using Touchdesigner to show binary computer language
Neben der tierischen Wahrnehmung steht die Datenverarbeitung durch das künstliche neuronale Netzwerk - auch 'Künstliche Intelligenz' genannt -. Diese digitale Instanz soll durch Animationen visualisiert werden. Die Verarbeitung durch den Computer soll in 'Stufen' dargestellt werden um den Zuschauer an das Thema heranzuführen und die zunehmen abstrakte Datenverarbeitung greifbar zumachen.
Die erste Ebene ist eine Art Veranschaulichungsebene in welcher der Datensatz der tierischen Perspektiven (die Filmaufnahmen) in einer digitalen 3D Ansicht zusehen ist. Der Zuschauer soll dem Datensatz als intaktes, Gesamtgebilde zusehen bekommen. In einem digitalen 'void-space' sehen wir den Datensatz der Videoaufnahmen und anschließend das künstliche neuronale Netz. Zuerst von außen, dann fliegt die Kamerasicht durch den Datensatz und das Netzwerk. Über diesen digitalen 'voidspace' navigiert das Filmnarrative in die unterschiedlichen Dateien des Datensatz i.e. Filmaufnahmen.
Der Verarbeitungsprozess durch den Computer wird zunehmend herunter gebrochen. Für die zweite Visualisierungsebene verwende ich im Schaffungsprozess neuronale Netzwerke die mit Bildverarbeitung zutuen haben. Es werden 'FlowNet2' und 'VGG16 visualisation' genutzt um einen tatsächlichen Einblick in die Verarbeitung durch den Computer zugeben. Das verwenden der Netzwerke selbst gibt einen Einblick in Bildgebendeverfahren der Computer Vision und somit einen 'echten Bezug' zu wie Video/Bild durch künstlische neuronale Netze verarbeitet werden.
In der reduziertesten Visualiserungsebene wird die binäre Verarbeitung durch den Computer auf Level der 'maschinellen Sprache' dargestellt. Der Computer selbst funktioniert im Grunde nur durch Code der sich zuletzt auf 1 und 0 reduziert. Diese Binärität wird mittels eines reduzierten Schwarz-Weiß Animationsstil aufgegriffen und künstlerisch weitergedacht. Dies entsteht in Zusammenarbeit mit August Guccione im Programm TouchDesigner. Die Wahl des Programm war wichtig, da dieses durch seine generativ 'Node' basierte Funktionsweise ebenfalls sehr nah am Computer selbst ist.
//
The film is composed of, on the one hand filmed footage i.e. 'animal perception' interpreted through a subjective camera in characteristic habitats and on the other, the data processing by an artificial neural network(ANNs). The dataset and it's processing through the AI network will be visualised via animations. The Visualisation has different 'stages' to introduce the viewer to the topic and to make the initially abstract data processing tangible.
The first level is a kind of visualisation level in which the dataset of the animal perspectives (filmed footage) is shown in a digital 3D view. In a digital 'void-space' we see the dataset and then the artificial neural network. First from the outside, then the camera view flies through the dataset and the network. Through this digital 'void space' the film narrative navigates into the different files of the dataset i.e. film recordings.
The processing by the computer will be increasingly broken down throughout the different 'stages' of visualisation. For the second level of visualisation, I use actual neural networks used for image processing in the computer science field. 'FlowNet2' and 'VGG16 visualization' are used to give an actual insight into the processing by the computer. By using ANNs themselves an actual insight into computer vision imaging techniques and thus a 'real reference' to how video/images are processed by artificial neural networks is inserted into the film.
In the most reduced level of visualisation, the binary processing by the computer is represented at the level of 'machine language'. The computer itself basically works only by code which at its core reduces to 1 and 0. This binary is interpreted in a reduced black and white animation style. These animations are created in collaboration with August Guccione in the program TouchDesigner. The choice of the program was important because this program is also very close to the computer itself through its generative 'Node' based functionality.
 
		
























