Végre érkeznek valóban hasznos mesterséges intelligencia funkciók a Windows operációs rendszerbe, a reklámok mellett!

A Microsoft egy új mérföldkőhöz érkezett az operációs rendszerében integrált mesterséges intelligencia terén: a Windows 11 Insider verziókban bemutatkozó Copilot Vision mostantól képes észlelni az egész képernyőt, nem csupán két alkalmazás ablakát, amennyiben úgy döntünk, hogy megosztjuk vele a látványt. Ez a vizuális megfigyelés lehetőséget ad arra, hogy a Copilot értelmezze a tartalmakat, hasznos tippeket nyújtson, és valós időben válaszoljon a feltett kérdésekre – mindezt természetes beszéd formájában.
A dolog nem teljesen új, tavaly már kísérletezett hasonlóval a Microsoft a nemrég fürgébbé vált Edge böngészőben, sőt mobilon is, de most vált igazán rendszerszintűvé. A redmondiak szerint az újítás nemcsak kreatív projekteknél vagy játék közben lehet hasznos, de például egy önéletrajz finomhangolásában is segíthet.
Amikor a hasznosságról beszélünk, érdemes megemlíteni az újonnan bevezetett Describe image funkciót, amely valóban hasznos eszköznek bizonyul. A Click to Do menüpont segítségével bármilyen képről automatikusan készíthetünk szöveges leírást, mindezt helyben, a számítógépünkön futó MI-modell segítségével, anélkül hogy adatokat kellene küldenünk. Ez a lehetőség nemcsak a gyengénlátók számára jelent előnyt, hanem mindenki számára, aki alternatív szövegeket kíván írni képekhez, dokumentumokat vagy cikkeket készít.
Természetesen van egy érdekesség a sztoriban: a leíró funkció jelenleg kizárólag a Snapdragon-alapú Copilot+ PC-ken érhető el, míg az AMD és Intel alapú gépekre ez még várat magára. Tehát, hogy mindenki számára hozzáférhetővé váljon, még szükséges egy kis türelem.