Пожелания и планы на будущее

Эксперименты с Midjourney, ChatGPT, Gemini, Claude, DALL-E, Stable Diffusion и Pika
elpresidente*
Site Admin
Reactions: 852
Сообщения: 2924
Зарегистрирован: Сб май 14, 2022 5:03 pm

Re: Пожелания и планы на будущее

Сообщение elpresidente* »

https://ai.google.dev/pricing
Gemini1.0.pro.png
Gemini1.0.pro.png (172.39 КБ) 157 просмотров
Gemini1.5.pro.png
Gemini1.5.pro.png (170.94 КБ) 157 просмотров
elpresidente*
Site Admin
Reactions: 852
Сообщения: 2924
Зарегистрирован: Сб май 14, 2022 5:03 pm

Re: Пожелания и планы на будущее

Сообщение elpresidente* »

👆
kyk писал(а): Ср апр 17, 2024 3:17 pm Исходя из сообщения выше получается что, начиная с 2 мая, бесплатного не будет вобще? А будет pay-as-you-go
Free вроде никуда не денется, pay-as-you-go это для тех кто будет использовать в production и не хочет делится своими данными.

Мне не нравится что в варианте REST API https://ai.google.dev/tutorials/rest_quickstart необходимо каждый раз пересылать всю историю (context) что будет проблематичено при обработке больших запросов в случае с 1.5, хотелось бы чтобы они делали сессию и держали весь context у себя :)

У меня уже есть доступ к 1.5 https://generativelanguage.googleapis.c ... ?key={{key}}

Код: Выделить всё

        {
            "name": "models/gemini-1.5-pro-latest",
            "version": "001",
            "displayName": "Gemini 1.5 Pro",
            "description": "Mid-size multimodal model that supports up to 1 million tokens",
            "inputTokenLimit": 1048576,
            "outputTokenLimit": 8192,
            "supportedGenerationMethods": [
                "generateContent",
                "countTokens"
            ],
            "temperature": 1,
            "topP": 0.95
        },
Причем 1.5 это multimodal модель и она поддерживает conversation context, вот хороший пример


Думаю можно попробовать добавить такого бота на сайт.
elpresidente*
Site Admin
Reactions: 852
Сообщения: 2924
Зарегистрирован: Сб май 14, 2022 5:03 pm

Re: Пожелания и планы на будущее

Сообщение elpresidente* »

Большие media файлы можно закачивать с помощью File API https://ai.google.dev/api/rest/v1beta/files
The File API lets you store up to 20GB of files per project, with each file not exceeding 2GB in size. Files are stored for 48 hours and can be accessed with your API key for generation within that time period. It is available at no cost in all regions where the Gemini API is available.
Prompting with media files https://ai.google.dev/tutorials/prompting_with_media
kyk
Reactions: 446
Сообщения: 6125
Зарегистрирован: Ср июн 15, 2022 6:54 pm

Re: Пожелания и планы на будущее

Сообщение kyk »

На данный момент, как соотносятся Gemini 1.5 и ChatGpt-4 API по "уровню интеллекта" если им обоим дать одинаковый контекст, скажем, 32,000 ?

И вот еще интересно:
kyk
Reactions: 446
Сообщения: 6125
Зарегистрирован: Ср июн 15, 2022 6:54 pm

Re: Пожелания и планы на будущее

Сообщение kyk »

elpresidente* писал(а): Ср апр 17, 2024 4:46 pm Мне не нравится что в варианте REST API https://ai.google.dev/tutorials/rest_quickstart необходимо каждый раз пересылать всю историю (context) ..

<skip>
Причем 1.5 это multimodal модель и она поддерживает conversation context, вот хороший пример
"поддерживает conversation context" --это Вы имеете ввиду следущее ? :

Код: Выделить всё

model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])

response = chat.send_message("In one sentence, explain how a computer works to a young child.")

response = chat.send_message("Okay, how about a more detailed explanation to a high schooler?")
Т.е. вся историю (context) сохраняется в 'chat.history' при многократном "response = chat.send_message()"

Насколько понимаю, в отличие от Gemini выше, у Claude 3 пока ещё нет опции "Сhat"
Claude 3 : The Messages API is stateless, which means that you always send the full conversational history to the API.
https://docs.anthropic.com/claude/refer ... s-examples
elpresidente*
Site Admin
Reactions: 852
Сообщения: 2924
Зарегистрирован: Сб май 14, 2022 5:03 pm

Re: Пожелания и планы на будущее

Сообщение elpresidente* »

kyk писал(а): Вт апр 30, 2024 7:21 pm На данный момент, как соотносятся Gemini 1.5 и ChatGpt-4 API по "уровню интеллекта" если им обоим дать одинаковый контекст, скажем, 32,000 ?
Размер контекста важен при обработке запросов но не определят качество модели.
elpresidente*
Site Admin
Reactions: 852
Сообщения: 2924
Зарегистрирован: Сб май 14, 2022 5:03 pm

Re: Пожелания и планы на будущее

Сообщение elpresidente* »

kyk писал(а): Вт апр 30, 2024 7:33 pm "поддерживает conversation context" --это Вы имеете ввиду следущее ? :
Все API поддерживают conversation context (history).
Пример для Gemini link, Claude и ChatGPT (OpenAPI) имеют практически тот-же самый формат.
Проблема в том что с большими файлами такой подход не будет работать, поэтому Google предлагает использовать File API.
Планирую добавить Gemini 1.5 multi modal с поддержкой больших файлов после того как Discord CDN будет стабильно работать, уже потратил на него несколько выходных, надеюсь доделать в этот викенд.
Ответить