Google ආයතනය මීට මාස දෙකකට පමණ කලින් Gemini 1.5 Model එක Google AI Studio එක හරහා පරීක්ශා කිරීමේ පහසුකම developers ලට ලබා දී තිබුනා. 2024/04/09 එනම් ඊයේ දින රටවල් 180ට වඩා වැඩි ප්රමාණයකට Gemini 1.5 Pro භාවිතා කිරීමෙ පහසුකම Gemini API හරහා ලබා දී තිබෙනවා. මෙහි තිබෙන විශේෂත්වය වෙන්නෙ එහි පලමු වරට Native audio understanding පහසුකමද, Files හැසිරවීමෙ පහසුව සදහා File API ද ලබා දීමයි. ඒ වගේම System Instructions සහ JSON mode යන අලුත් features ද ලබාදීම නිසා Developers ලට Model Output එක අවශ්ය පරිදි හැසිරවීමෙ පහසුවද ඇති බව වැඩි දුරටත් පවසා සිටිනවා.
ඒ වගේම Gemini 1.5 Pro LLM(Large Language Model) එකට මුලදී හැකිවුනේ Text, Images සහ Audio වෙන වෙනම හදුනා ගැනීමෙ සහ සකස් කිරීමේ පහසුකම පමණයි. නමුත් එයට ලබා දෙන වීඩියෝවකින්, Images (Frames) සහ Audio එකවර හදුනා ගැනීමෙ පහසුකම පවතිනවා.
Ex - 117,000 + token සහිත Jeff Dean ගේ Lecture එකක වීඩියෝව upload කිරීමෙන් පසු Gemini 1.5 Pro මගින් ප්රශ්ණ සෑදීම.
මෙම පහසුකම තවමත් Google AI studio හරහා පමණක් ලබා දී ඇති අතර, මේ සදහා API පහසුකම ලබා දීමටද ඉක්මනින් පියවර ගනු ලබන බව පවසනවා.
Gemini API improvements
1. System Instructions - ඔබගේ අවශ්යතා මත roles, formts , goals සහ rules ලබා දී මොඩලයේ හැසිරීම Google AI studio සහ Gemini API වෙත ලබා දී ඇත.
2. JSON Mode - Text සහ Images වෙතින් ලබා ගන්නා දත්ත වෙන්කර ගැනිමෙ පහසුව උදෙසා මොඩලය JSON Objects ලබාදෙන පරිදි සකස් කිරීමෙ පහසුකම
3. Improvements to function calling
Source: developers.googleblog.com