ਗੂਗਲ ਨੇ ਨਵਾਂઠAI ਮਾਡਲઠGemini 2.5 Computer Use ਪੇਸ਼ ਕੀਤਾ ਹੈ ਜੋ ਵਰਚੁਅਲ ਬ੍ਰਾਊਜ਼ਰ ਰਾਹੀਂ ਵੈੱਬ ਨੂੰ ਨੈਵੀਗੇਟ ਅਤੇ ਸਰਫ਼ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਫਾਰਮ ਭਰਨ ਵਰਗੇ ਕੰਮ ਵੀ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਮਾਡਲઠGemini 2.5 Pro ‘ਤੇ ਅਧਾਰਿਤ ਹੈ ਅਤੇ ਇਸ ਵਿੱਚ ”ਵਿਜ਼ੂਅਲ ਸਮਝ ਅਤੇ ਤਰਕਸ਼ੀਲ ਸਮਰੱਥਾ” ਹੈ। ਇਹ ਸਿਰਫ਼ ਯੂਜ਼ਰ ਪ੍ਰੰਪਟ ਤੋਂ ਨਿਰਦੇਸ਼ ਲੈ ਕੇ ਕੰਮ ਕਰਦਾ ਹੈ। ਬਲੌਗ ਪੋਸਟ ਵਿੱਚ ਦੱਸਿਆ ਗਿਆ ਕਿ ਜਦੋਂ ਕਿ ਕਈઠAI ਮਾਡਲ ਸਟਰੱਕਚਰਡઠAPI ਰਾਹੀਂ ਸਾਫਟਵੇਅਰ ਨਾਲ ਇੰਟਰਫੇਸ ਕਰ ਸਕਦੇ ਹਨ, ਬਹੁਤ ਸਾਰੇ ਡਿਜੀਟਲ ਕੰਮ ਅਜੇ ਵੀ ਗ੍ਰਾਫਿਕਲ ਯੂਜ਼ਰ ਇੰਟਰਫੇਸ ਦੁਆਰਾ ਸਿੱਧਾ ਇੰਟਰੈਕਸ਼ਨ ਮੰਗਦੇ ਹਨ। ਉਦਾਹਰਣ ਵਜੋਂ, ਫਾਰਮ ਭਰਨਾ ਅਤੇ ਸਬਮਿਟ ਕਰਨਾ। ਇਸ ਲਈ ਅੀ ਏਜੰਟ ਨੂੰ ਵੈੱਬ ਪੇਜ਼ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਨੂੰ ਮਨੁੱਖਾਂ ਵਾਂਗ ਕਲਿੱਕ, ਟਾਈਪ ਅਤੇ ਸਕ੍ਰੋਲ ਕਰਨਾ ਪੈਂਦਾ ਹੈ। ਯੂਜ਼ਰਾਂ ਨੂੰ ਕਿਸੇઠAPI ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਸਿਰਫ਼ ਉਹਨਾਂ ਨੂੰ ਇੰਪੁੱਟ ਦੇਣੇ ਪੈਂਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਵਾਤਾਵਰਣ ਦੀ ਸਕ੍ਰੀਨਸ਼ਾਟ, ਹਾਲ ਹੀ ਵਿੱਚ ਕੀਤੇ ਕੰਮਾਂ ਦਾ ਇਤਿਹਾਸ ਅਤੇ ਕੋਈ ਫੰਕਸ਼ਨ ਸ਼ਾਮਿਲ ਹੋ ਸਕਦੇ ਹਨ।ઠAI ਮਾਡਲ ਇਹ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਕੇ ਕੰਮ ਕਰਦਾ ਹੈ।
ਗੂਗਲ ਨੇ ਇਹ ਵੀ ਕਿਹਾ ਕਿઠAI ਮਾਡਲ ਸਿਰਫ਼ ਬ੍ਰਾਊਜ਼ਰ ਤੱਕ ਪਹੁੰਚ ਰੱਖਦਾ ਹੈ, ਪੂਰੇ ਕੰਪਿਊਟਰ ਵਾਤਾਵਰਣ ਤੱਕ ਨਹੀਂ। ਇਹ ਮਾਡਲ ਮੋਬਾਈਲઠUI ਕੰਟਰੋਲ ਟਾਸਕਾਂ ਵਿੱਚ ਸਮਾਨ ਪ੍ਰਦਰਸ਼ਨ ਦਿਖਾਉਂਦਾ ਹੈ ਪਰ ਡੈਸਕਟਾਪઠOS-lYvl ਕੰਟਰੋਲ ਲਈ ”ਆਪਟਿਮਾਈਜ਼ਡ” ਨਹੀਂ ਹੈ।
ਡਿਵੈਲਪਰઠGemini API ਰਾਹੀਂઠGoogle AI Studio ਅਤੇઠVertex AI ਵਿੱਚઠGemini 2.5 Computer Use ਮਾਡਲ ਤੱਕ ਪਹੁੰਚ ਸਕਦੇ ਹਨ। ਇਸ ਮਾਡਲ ਦੇ ਹੋਰ ਵਰਜ਼ਨ ਪਹਿਲਾਂઠProject Mariner ਲਈ ਵਰਤੇ ਗਏ ਹਨ, ਜੋ ਕਿ ਅੀ ਏਜੰਟਾਂ ਨੂੰ ਟਾਸਕ ਪੂਰੇ ਕਰਨ ਲਈ ਪ੍ਰਯੋਗ ਕਰਦਾ ਹੈ, ਅਤੇ ਕੁਝ ਏਜੰਟਿਕ ਸਮਰੱਥਾਵਾਂ ਲਈઠAI Mode in Search ਵਿੱਚ ਵਰਤਿਆ ਗਿਆ। ਗੂਗਲ ਦਾ ਮੰਤਵ ਹੈ ਕਿ ਇਹ ਮਾਡਲ ਯੂਜ਼ਰਾਂ ਨੂੰ ਸਾਫਟਵੇਅਰ ਇੰਟਰਫੇਸ ਦੇ ਨਾਲ ਸਿੱਧਾ ਕੰਮ ਕਰਨ ਅਤੇ ਵੱਖ-ਵੱਖ ਡਿਜੀਟਲ ਟਾਸਕਾਂ ਨੂੰ ਆਸਾਨੀ ਨਾਲ ਪੂਰਾ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਦੇਵੇ।

