Team der chinesischen Tsinghua Universität bringt das Sora-ähnliche KI-Videomodell „Vidu“ auf den Markt

KI-Nachrichten4Monaten gepostet Deepality
64 0 0

Chinas KI-Technologie zur Videogenerierung erzielt einen großen Durchbruch

Angetrieben von der KI-Technologie erlebt der Bereich der Erzeugung von Videoinhalten eine Revolution. Vor kurzem hat das neueste große Videomodell „Vidu“, das von BioDigital Technology in Zusammenarbeit mit der Tsinghua Universität veröffentlicht wurde, in der Branche große Aufmerksamkeit erregt. Das Modell unterstützt die Erzeugung von hochauflösenden Videoinhalten mit einer Länge von bis zu 16 Sekunden und einer Auflösung von 1080p mit einem Klick und stellt damit einen wichtigen Durchbruch in der chinesischen KI-Videotechnologie dar. Diese Errungenschaft demonstriert nicht nur den Fortschritt der einheimischen KI-Technologie, sondern bietet auch neue Werkzeuge für die Ersteller von Videoinhalten.

„ Vergleich der technischen Merkmale von Vidu mit Sora

„Die Leistung von Vidu in den Bereichen Multikamerasprache, zeitliche und räumliche Konsistenz und Einhaltung der physikalischen Gesetze ist herausragend und vergleichbar mit Sora, der führenden internationalen KI-Videogenerierungstechnologie. Das Modell ist in der Lage, surrealistische Bilder zu fiktionalisieren, die es in der realen Welt nicht gibt, und demonstriert damit Fähigkeiten, die mit aktuellen Modellen zur Videogenerierung nur schwer zu erreichen sind. Der Erfolg dieser Technologie zeigt nicht nur die Stärke der einheimischen KI-Videogenerierungstechnologie, sondern bietet auch einen breiten Raum für die Entwicklung und Anwendung dieser Technologie in der Zukunft.

Innovation und Anwendung von „Vidu“-generierten Videos

Die Innovation von „Vidu“ liegt nicht nur in der Länge des Videos, sondern auch in seiner reichhaltigen „Objektivsprache“. Durch verschiedene Kameraeinstellungen und -bewegungen ist Vidu in der Lage, die Handlung auszudrücken, die Psychologie der Figuren zu enthüllen, eine Atmosphäre zu schaffen und die Emotionen des Zuschauers zu lenken. Diese Fähigkeit verleiht den von „Vidu“ erstellten Videos einen stärkeren Sinn für die Erzählung und die Anschaulichkeit. Darüber hinaus behält „Vidu“ die Konsistenz von Zeit und Raum bei und bietet so mehr Möglichkeiten für die Erstellung von Videoinhalten.

„Technologie und Team hinter “Vidu

Die erfolgreiche Entwicklung von „Vidu“ ist der Tatsache zu verdanken, dass die zugrunde liegende Schicht auf der vollständig selbst entwickelten U-ViT-Architektur basiert, die die Stärken von Diffusion und Transformer vereint und eine hervorragende Emergenzfähigkeit aufweist. Mit einer soliden technischen Grundlage und eingehender Forschung zu grafischen Aufgaben hat das Team von BioDigital schnell einen technologischen Durchbruch erzielt. Die Kernmitglieder des Teams kommen vom Institut für Künstliche Intelligenz der Tsinghua Universität und verfügen über einen fundierten akademischen Hintergrund und reiche praktische Erfahrung.

Die Aussichten für die KI-Videoproduktionstechnologie in China

Mit dem Start von „Vidu“ ist die Zukunft der chinesischen KI-Videoproduktionstechnologie voller Hoffnung. Die flexible Architektur des Modells deutet darauf hin, dass es mit einem breiteren Spektrum an multimodalen Fähigkeiten kompatibel sein wird und die Erzeugung vielfältigerer und längerer Videoinhalte unterstützt. Dies wird nicht nur die Entwicklung der heimischen KI-Technologie fördern, sondern auch die Erstellung von Videoinhalten revolutionieren. Es wird erwartet, dass sich „Vidu“ mit der kontinuierlichen Weiterentwicklung der Technologie zu einem universellen visuellen Modell entwickeln wird, das die Erstellung vielfältigerer und längerer Videoinhalte unterstützt und die weitere Entwicklung der einheimischen KI-Technologie in China fördert.

© Copyright-Erklärung
广告也精彩

Verwandte Artikel: