Loading...
Gemini 1.5 Pro දැන් රටවල් 180කටත් වැඩි ප්‍රමාණයකට

Google ආයතනය මීට මාස දෙකකට පමණ කලින් Gemini 1.5 Model එක Google AI Studio එක හරහා පරීක්ශා කිරීමේ පහසුකම developers ලට ලබා දී තිබුනා. 2024/04/09 එනම් ඊයේ දින රටවල් 180ට වඩා වැඩි ප්‍රමාණයකට Gemini 1.5 Pro භාවිතා කිරීමෙ පහසුකම Gemini API හරහා ලබා දී තිබෙනවා. මෙහි තිබෙන විශේෂත්වය වෙන්නෙ එහි පලමු වරට Native audio understanding පහසුකමද, Files හැසිරවීමෙ පහසුව සදහා File API ද ලබා දීමයි. ඒ වගේම System Instructions සහ JSON mode යන අලුත් features ද ලබාදීම නිසා Developers ලට Model Output එක අවශ්‍ය පරිදි හැසිරවීමෙ පහසුවද ඇති බව වැඩි දුරටත් පවසා සිටිනවා.


ඒ වගේම Gemini 1.5 Pro LLM(Large Language Model) එකට මුලදී හැකිවුනේ Text, Images සහ Audio වෙන වෙනම හදුනා ගැනීමෙ සහ සකස් කිරීමේ පහසුකම පමණයි. නමුත් එයට ලබා දෙන වීඩියෝවකින්, Images (Frames) සහ Audio එකවර හදුනා ගැනීමෙ පහසුකම පවතිනවා.

Ex - 117,000 + token සහිත Jeff Dean ගේ Lecture එකක වීඩියෝව upload කිරීමෙන් පසු Gemini 1.5 Pro මගින් ප්‍රශ්ණ සෑදීම.

screen grab of a clooege professor using Gemini 1.5 Pro to create a quiz based on their latest lecture video in Google AI Studio
You can upload a recording of a lecture, like this 117,000+ token lecture from Jeff Dean, and Gemini 1.5 Pro can turn it into a quiz with an answer key. [Video sped up for demo purposes]

මෙම පහසුකම තවමත් Google AI studio හරහා පමණක් ලබා දී ඇති අතර, මේ සදහා API පහසුකම ලබා දීමටද ඉක්මනින් පියවර ගනු ලබන බව පවසනවා.

Gemini API improvements


1. System Instructions - ඔබගේ අවශ්‍යතා මත roles, formts , goals සහ rules ලබා දී මොඩලයේ හැසිරීම Google AI studio සහ Gemini API වෙත ලබා දී ඇත.

image showing where System Instructions is located in Google AI Studio
Set System Instructions easily in Google AI Studio


2. JSON Mode - Text සහ Images වෙතින් ලබා ගන්නා දත්ත වෙන්කර ගැනිමෙ පහසුව උදෙසා මොඩලය JSON Objects ලබාදෙන පරිදි සකස් කිරීමෙ පහසුකම

3. Improvements to function calling


Source: developers.googleblog.com