ComputerenInformatiounen Technik

Modern Computer Visioun. Aufgaben a Computer Visioun Technologie. Programméiere Computer Vision vun Python

Wéi e Computer ze léieren ze verstoen, wat am Bild oder Biller duergestallt gëtt? Dëst schéngt einfach, mä fir e Computer dat ass just eng Matrixentgasung aus Nullen an déi aus deenen Dir wichteg Informatiounen zu Extrait wëllen.

Wat ass Computer Visioun? Et ass de Spiller drop agestallt fir "gesinn" Äre Computer

Visioun - ass eng wichteg Quell vun Informatiounen fir déi Persoun et benotzt, kréien mir, laut verschiddenen Schätzung, vun 70 bis 90% vun all Informatiounen. An, natierlech, wa mer e Smart Auto ze schafen wëllen, brauche mer déi selwecht Fäegkeeten a Computer ze realiséieren.

De Problem vun Computer Visioun kann relativ kloer ginn. Wat ass "gesinn"? Et ass verstan, datt wou et just duerch sicht. Datt ofgeschloss d'Ënnerscheeder vun Computer Visioun a mënschlech Visioun. Visioun fir eis - et ass eng Quell vu Wëssen iwwer der Welt, wéi och eng Source vun Informatiounen Tonne - dat heescht, déi ëmmer d'Distanzen a Formen ze verstoen.

Schüler sätzt Bild

Kuckt um Bild, kann mer et duerch eng Rei vun Attributer beschreiwen, esou ze schwätzen, Gebai Informatiounen zu Extrait.

Zum Beispill, bei dësem Bild kuckt, kënne mir soen, datt et dobaussen ass. Wat ass d'Stad Verkéier. Dat do sinn Autoen. mir kënnen denken, datt dëst Süd-Osten Asien op der Konfiguratioun vum Gebai an hieroglyphics ass. De Portrait vun Mao Zedong verstoen, datt dëst Peking ass, a wann een liewen Video gesinn oder selwer haten et schonn, géif denken, dass dëst de berühmte Tiananmen Square ass.

Wat kënne mir méi iwwert d'Bild soen, et gesinn? Mir kënnen Objeten am Bild z'identifizéieren, ze soen, dass et de Leit hei méi no - Dauwen. Hei Prabbelien, Plakater d'datt Gebai. Dës si Beispiller vu Klassen ass ganz wichteg Saachen, déi op der Sich fir de Moment engagéiert sinn.

Nach kënne mir e puer vun de Fonctiounen oder Attributer vun Objete léieren. Zum Beispill, bestëmmen kënne mir hei, datt dëst net e Portrait vun engem normal Chinese ass, nämlech, Mao Zedong.

No kann den Auto alles ginn, datt et e Plënneren Objet ass, an et ass schwéier, dass während der Beweegung net deforméiert ass. Iwwert kann Fändelen gesot ginn, datt et Objeten, sinn bewegt se och, mee si sinn net schwéier, permanent deforméiert. An an der Zeen do ass de Wand, deen duerch den Entwécklungslänner Fändelen gin alles kann, an kann och d'Direktioun vun der Wand bestëmmen, zum Beispill, et ass vu lénks no riets garde.

D'Distanzen an Virsaz am Computer Visioun

Ganz wichteg ass d'Tonne Informatiounen iwwert Computer Visioun Wëssenschaft. Dëst ass all Zorte vun Distanzen. Zum Beispill, ass fir d'Rover besonnesch wichteg, well d'Équipen aus der Äerd ëm 20 Minutte sinn a wéi vill Äntwert. Anere Wierder, de Link do an zréck - 40. Minutt. A wa mer e Plang fir herrlechen commandéiert vun der Äerd maachen, muss Dir dës Rechnung ze huelen.

Erfollegräich integréiert der Technologie vun Computer Visioun am Video Spiller. No de Video, kënnt dir dräi-zweedimensional Modeller vun Objeten, Leit bauen, an Fotoen op de Benotzer kënnen déi dräi-zweedimensional Modeller vu Stied restauréiert. An dann op se trëppelt.

Computer Visioun - eng zimlech grouss Gamme. Et ass enk mat verschiddenen anere Wëssenschaften intertwined. Deel vun Computer Visioun Et Treffer der Veraarbechtung Beräich Bild an heiansdo allocates Computer Visioun, historesch.

Analyse, Muster Unerkennung - de Wee bis op d'Schafung vun Luxuszëmmer Intelligenz

Loosst eis dës Konzepter getrennt ënnersicht.

Bildveraarbechtung - dat ass en Deel vun algorithms, an deem de Input an Wasserstoff - Bild, a mir him eppes hutt.

Bild Analyse - ass de Beräich vun Computer Visioun, déi mat den zwee-zweedimensional Bild op schaffen axéiert an maachen Conclusiounen aus deem.

Muster Unerkennung - eng mythologesch mathematesch Nawell dass Daten an der Form vun vectors erkennt. Dat ass, bei der Entrée - Vecteure a mir hunn eppes mat dat ze maachen. Wou de Vecteure ass, si mir net esou wichteg ze wëssen.

Computer Visioun - et war ursprénglech d'Struktur vun der zwee-zweedimensional Biller ze restauréieren. Haut dëser Géigend nach méi breet ginn an et kann als Akzeptanz vun all vun der physesch Objeten interpretéiert ginn nees, baséiert op d'Bild. Dat ass, et ass d'Aufgab vun kënschtlech Intelligenz.

An parallel mat Computer Visioun an enger komplett anerer Plaz, an der Geodesie, photogrammetry huet Perséinlechkeeten - eng Miessung vun der Distanz tëscht Objeten op zwee-zweedimensional Biller.

Roboteren kann "gesinn"

An endlech - dat ass Maschinn Visioun. Ënnert der Maschinn Visioun heescht eng Visioun vu Roboteren. Dat ass d'Decisioun vun e puer Produktioun Problemer. Mir kënne soen, dass Computer Visioun - eng grouss Wëssenschaft ass. Si kombinéiert e puer vun den anere Wëssenschaften Deel. A wann de Computer Visioun politëscher Demande kritt, gëtt et nees eng Maschinn Visioun.

Computer Visioun Regioun huet eng Mass vun praktesch Uwendungen. Et ass mat der Bekannte vun Produktioun assoziéiert. Um Betriber méi efficace manuell Aarbechtsmaart duerch Maschinn ze schounen. Der Maschinn net midd et kréien, net schlofen, si haten onregelméisseg schaffen Zäitplang, ass si bereet 365 Deeg am Joer ze schaffen. Also mat der Maschinn schaffen, kënne mir e garantéiert Resultat bei engem bestëmmte Zäit kréien, an et ass ganz interessant. All Aufgaben hunn eng kloer benotzen fir Computer Visioun Systemer. An et ass näischt besser wéi d'Resultater direkt op der Foto an der Berechnung Etapp nëmmen ze gesinn.

Op der loung vun der Welt vun kënschtlech Intelligenz

Plus der Géigend - et ass schwéier! E groussen Deel vum Gehir responsabel fir Visioun, an et gëtt ugeholl, datt wann Dir Äre Computer ze "gesinn" léieren, dat ass, déi voll benotzen Computer Visioun, et ass eent vun de Ziler vun voll kënschtlech Intelligenz. Wa mir de Problem op der mënschlecher Niveau léisen kann, déi meescht wahrscheinlech gläichzäiteg, wäerte mir de Problem vun AI léisen. Dat ass ganz gutt! Oder net ganz gutt, wann Dir kuckt, "Terminator 2".

Firwat ass Visioun - et schwéier ass? Well d'Bild vun der selwechter Objet variéieren kann op extern Faktoren immens jee. Jee no der Objet vun Observatioun Punkten kucken verschidden.

Zum Beispill, eng an déi selwecht Figur, aus verschiddene Heffernan geholl. A wat ass déi interessant an d'Figur kann ee kucken, zwee Aen an eng hallef sinn. An je Kader (wann dëst Bild vum Mann an engem Hiem mat gemoolt Aen), kann d'Aen méi wéi zwee ginn.

De Computer et nach net verstoen, mä et "gesäit"

Anere Faktor datt et schwéier mécht - et ass d'Beliichtung. Déi selwecht Szen mat verschiddene Beliichtung wäert anescht kucken. Objet Gréisst kann variéieren. Ausserdeem, d'Objete vun all Klass. Wéi kann Dir soen iwwer e Mann, deen seng Héicht vun 2 Meter? Näischt. Mënsch Wuesstem a vläicht 2,3 m an 80 cm gin. Als mat aner Zorte vun Objeten, awer Objete vun der selwechter Klass sinn.

Besonnesch rufflech Liewensstandard Objete enger Varietéit vun analyséieren. Hoer Leit, Sportler, Déieren. Bléck op Biller vun Päerd lafen, bestëmmen, wat mat hir Mane ass geschitt an Schwäif ass einfach onméiglech. A ärem Objeten an engem Bild? Wann Dir e Computer Bild wessentschaftlech, och de mächtegste Maschinn Schwieregkeeten fannen déi richteg Entscheedung ginn.

Nächst Vue - et ass eng Verkleedung. E puer Objete, masquerading Déiere wéi d'Ëmwelt, an nawell Bande. An déi selwecht Flecken a gemoolt. Trotzdem, gesinn si mer, obwuel net ëmmer vu wäitem.

Anere Problem - der Bewegung. Objeten am Dréchnen denkbar rufflech Deformatiounen.

Vill vun den Objeten sinn ganz ofwiesselnd. Hei, zum Beispill, an déi zwou Fotoen Kraaft ënnert d'Objete vun der "Stull".

An op dat kann Dir sëtzt. Mee eng Maschinn ze léieren, esou datt déi verschidde Saachen an Form, Faarf, Material, alles ass en Objet "Stull" - ass ganz schwéier. Dëst ass d'Erausfuerderung. Fir Methode vun Computer Visioun intégréieren - ass eng Maschinn ze léieren ze verstoen, analyséieren, spekuléieren.

Integratioun vun Computer Visioun vun verschiddenen Plattformen

D'Mass vun Computer Visioun ugefaang méi vun 2001 bis gelongen, wou hien déi éischt Gesiicht heescht geschaf. Mir huet et zwee Auteuren: Viola, Jones. Et war déi éischt séier an zouverlässeg genuch Algorithmus, déi d'Muecht vum Maschinn Léieren Methoden bewisen.

Elo Computer Visioun hunn genuch nei praktesch Uwendungen - Unerkennung vun der mënschlecher Gesiicht.

Mee un de Mann wéi an de Filmer erkannt - an ënnerschiddleche Engelen, verschidden Beliichtung Konditiounen - et onméiglech ass. Mä de Problem ze léisen, oder een, datt verschidde Leit mat verschiddene Beliichtung d'oder an enger anerer verkleeden, ähnlech wéi an der Foto an der Pass, ass et méiglech mat engem héije Mooss vun Vertrauen.

e Pass Foto Ufuerderunge haaptsächlech wéinst der Fonktioun vun der Gesiicht Unerkennung algorithms.

Zum Beispill, wann Dir engem biometresche Pass hunn, an e puer modernen Flughafen, kanns de automatesch Pass Kontroll System benotzt.

Ongeléist Problem vun Computer Visioun - d'Fähegkeet all Text ze erkenne

Vläicht benotzt een OCR System. Eent vun dësen - en och nach labber Reader, ass ganz beléift an RuNet System. Et gi vill Formen, wou Dir an der Daten fëllt, se perfekt gescannt sinn, ass d'Informatioun vun de System unerkannt ganz gutt. Mä mat all Text am Bild ass d'Situatioun vill méi schlecht. Dëse Problem bleift nach Ongeléist.

Games sensibiliséieren Computer Visioun, Weeër geleet Fondplaz

Separat grouss Beräich - ass d'Kreatioun vun dräi-zweedimensional Modeller a Weeër geleet Fondplaz (déi ganz erfollegräich am Computer Spiller ëmgesat ass). Déi éischt Programm, dee Computer Visioun benotzt - e System vun dÉxistenz de Computer benotzt passen. Wann et geschaf gouf et war oppen vill Saachen.

D'Algorithmus ass ganz einfach entworf, mä bis Konfiguratioun et e Generator vun syntheteschen Biller vun Leit ze schafen an eng Milliounen Fotoen ze kréien. Supercomputer mat hinnen d'Parameter vun der Algorithmus ze wielen, fir déi hien elo gutt funktionéiert.

Dat ass eng Millioun Biller an Woch countable supercomputer Zäit méiglech eng Algorithmus ze schafen, datt 12% vun der Muecht vun ee Prozessor verbraucht an erméiglecht eng Persoun der Positioun am richtege Moment ze zréckkommen. Dëst Microsoft Déifstall System (2010).

Sich no Biller vum Inhalt erlaabt Iech Fotoen un de System doranner, an d'Resultater vun et ginn all d'Fotoen mat den selwechten Inhalt an huet aus dem selwechte Wénkel.

Beispiller vun Computer Visioun: dräi-zweedimensional an zwee-zweedimensional Kaarten elo gi mat et gemaach. Kaarten fir Navigatioun Autoen sinn no der DVR regelméisseg aktualiséiert.

Et ass eng Datebank mat Milliarden vun geotagged Fotoen. Vun eroflueden d'Bild an der Datebank, kënnt Dir bestëmmen wou et war, an och mat e puer Perspektiv. Natierlech gëtt, datt d'Plaz populär genuch ass d'Touristen, datt bei eng Zäit an gemaach hunn do eng Rei vu Fotoe vun der Géigend ginn.

Robotere sinn iwwerall

Nächst Joer am Moment, iwwerall, ouni et an all Manéier. Elo ginn et Gefierer datt speziell Kameraen hunn dass gerannt an Scheider erkennen Befeeler fir de Chauffer ze weiderginn (dat op eng Manéier engem Computer Programm ze Vue, hëlleft den ACL). An et ass eng komplett automatiséiert Roboter Gefierer, mä se kann net ouni de Gebrauch vun enger grousser Quantitéit vu zousätzlech Informatiounen eleng op de Video Kamera System vertrauen.

Modern Kamera - dëst ass eng analog Kamera obscura

Loosst d'iwwer d'digitale Bild schwätzen. Modern digital Kameraen sinn op de Prinzip vun der Kamera obscura arrangéiert. Nëmmen amplaz vum Lach duerch déi Liichtjoer der hëlze a rengt hannen Mauer vun der Chamber vun de Sujet Circuit Prënzenhochzäit, hu mir e spezielle System opteschen der Lens genannt. Seng Objet ass eng grouss Liichtjoer hëlze ze sammelen an et geflunn sou datt all d'Strahlen duerch eng virtuell Punkt fir den d'Projektioun ze kréien an en Bild op Film oder Matrixentgasung Form.

Modern digital Kameraen (Matrixentgasung) ass vun eenzel Elementer aus - Pixel. All Pixel kann der Energie vum Liicht Moossnam déi Tëschefall op der Pixel Ganzen ass, an ee Wasserstoff Zuel Thema. Dofir, an engem digital Kamera, kréien mir amplaz vum Bild Hellegkeet Formatioun Liichtjoer Miessunge, an engem eenzege Pixel séier - de Computer Beräich vun Vue. Dofir, wann d'Bild mir gesinn ass net Linnen a kloer contours leeft, an enger Course vun faarweg Plaatzen a verschiddene Faarwen - Pixel.

Ënnert Dir gesinn déi éischt digitale Bild vun der Welt.

Mä an dësem Bild ass net? Faarf. Wat ass Faarf?

Psychesch Perceptioun vun Faarf

Faarf - dat ass wat mir gesinn. D'Faarf vum eent an dat selwecht Saach fir Mënschen a Kazen wäert anescht ginn. Well mir (Mënschen) an Déier opteschen System - d'Visioun ass anescht. Dofir, d'Faarf - d'et psychesch Qualitéit vun eiser Visioun dat geschitt, wann Objeten a Liicht Observatioun. An net eng kierperlech Besëtz vum Objet an d'Luucht. Faarf - ass d'Resultat vun der Interaktioun vun Liichtjoer Komponente, an der Zeen vun eiser visuell System.

Programméiere Computer Vision vun Python mat Bibliothéiken

Wann Dir decidéiert hunn eescht an der Etude vun Computer Visioun ze engagéieren, direkt fir eng Rei vu Schwieregkeeten preparéiere soll, ass dës Wëssenschaft net am einfachsten a verstoppt eng Rei vun alleng. Mee "Programméiersprooch Computer Vision op der Python" den Autorerechter vun Jan Erik Solema - e Buch, datt all déi einfach Sprooch enger. Hei fannt dir mat der Methode vun Unerkennung vun verschidden Objeten am 3D besser kréien, léieren mat der Stereo Bild, virtuell Realitéit a vill aner Programmer vum Computer Visioun ze schaffen. Am Buch gi genuch Beispiller zu Python. Mä d'Explikatioune sinn presentéiert, esou ze schwätzen, generaliséiert ginn, esou wéi net zevill Fuerschung deene bis an haarder Daten. Aarbecht gëeegent fir Studenten, Beaujolais, an begeeschteren. Download dëst Buch an déi aner iwwer Computer Visioun (pdf-Format) kann am Netz ginn.

Am Moment, sinn do Open Source Bibliothéik vun Computer Visioun algorithms an Bild Veraarbechtung an z'identifizéieren OpenCV algorithms. Et ëmgesat ass op deene modernste programméiere Sproochen, ass Open Source. Wa mir iwwer Computer Visioun schwätzen, Python als programméiere Sprooch benotzt, et och der Ënnerstëtzung vun der Bibliothéik huet, nieft, ass et permanent entwéckele sech an huet eng grouss Gemeinschaft.

D'Firma "Microsoft" stellt seng Servicer Api-gebass der Mä Reseau ze trainéieren et mat Biller vu Leit ze schaffen. Et ass och d'Geleeënheet Computer Visioun ze gëllen, benotzt Python als programméiere Sprooch.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 lb.delachieve.com. Theme powered by WordPress.