Los modelos generativos de IA están cambiando la forma en que creamos contenido, ya sea texto, imágenes, video o código. Con el SDK Gen Ai Python de Google, ahora puede ceder e interactuar con los modelos de IA generativos de Google en sus aplicaciones Python más fácilmente, encima de usar la API de desarrollador de Gemini y API de vértice ai. Eso significa que los desarrolladores pueden crear más fácilmente aplicaciones, incluidos chatbots, generadores de contenido o herramientas creativas. En este artículo, cubriremos todo lo que necesita aprender para comenzar a usar el SDK de Google Gen Ai Python.
Lea todavía: Construir un maniquí LLM usando Google Gemini API
¿Cuál es el SDK de Google Gen Ai Python?
El SDK de Google Gen Ai Python es una biblioteca de clientes para que los desarrolladores usen las habilidades generativas de IA de Google fácilmente usando Python. Proporciona:
- Soporte para Gemini Developer API (texto reformista de Google y modelos generativos multimodales)
- Integración con Vertex AI API para cargas de trabajo AI a escalera empresarial
- Soporte para difundir texto, imágenes, videos, incrustaciones, conversaciones de chat y más
- Herramientas para la compañía de archivos, el almacenamiento en elegancia y el soporte de async
- Características de aplicación de funciones avanzadas y aplicación de esquema
Este SDK todavía abstrae gran parte de la complejidad en torno a las llamadas de API y le permite concentrarse en construir aplicaciones con AI.
Instalación
Instalar el SDK es simple. Pasar:
pip install google-genai
El comando susodicho instalará el paquete SDK de Google Gen Ai Python usando PIP. Este comando descarga todo lo que necesita para el entorno Python para iniciar los servicios de AI generativos de Google, incluidos los bienes y todas las dependencias.
Importaciones y configuración del cliente
Una vez que haya instalado el SDK, cree un archivo Python e cuantía el SDK:
from google import genai
from google.genai import types
El SDK tiene dos módulos: Genai y tipos. El módulo Genai crea un cliente utilizado para la interacción API, mientras que el módulo tipos tiene estructuras de datos y clases que sirven como ayudantes utilizados para crear solicitudes y configurar los parámetros de solicitud.
Creará una instancia del cliente para cada interacción con los modelos AI generativos de Google. Instanciará al cliente con diferentes métodos dependiendo de la API que esté utilizando.
Para la API de Gemini Developer, puede instanciar al cliente pasando su secreto API:
client = genai.Client(api_key='YOUR_GEMINI_API_KEY')
Usted instancia al cliente, puede interactuar con la API de desarrollador de Gemini pasando su secreto API. Este cliente se encargará del token de entrada y la trámite de solicitudes.
Opcional: Uso de Google Cloud Vertex AI
client = genai.Client(
vertexai=True,
project="your-project-id",
location='us-central1'
)
Si va a utilizar Google Cloud Vertex AI, inicializará el cliente de forma diferente especificando la ID del esquema y la ubicación.
Nota: El uso de Vertex AI es opcional. Puede Crea tu ID de esquema aquí.
Si no usa Vertex AI, simplemente puede usar el método de la secreto API susodicho.
Traducción y configuración de API
Por defecto, el SDK utiliza puntos finales beta para ceder a las funciones beta. Sin retención, si desea utilizar API estables, puede especificar la lectura API utilizando el argumento HTTP_OPTIONS:
from google.genai import types
client = genai.Client(
vertexai=True,
project="your-project-id",
location='us-central1',
http_options=types.HttpOptions(api_version='v1')
)
Depende de usted cómo desea proceder a equilibrar la estabilidad con las características de vanguardia.
Uso de variables de entorno (opcional)
En lado de advenir directamente las teclas, primero debemos establecer variables de entorno:
API de desarrollador de Géminis:
export GEMINI_API_KEY='your-api-key'
Vértice ai:
export GOOGLE_GENAI_USE_VERTEXAI=true
export GOOGLE_CLOUD_PROJECT='your-project-id'
export GOOGLE_CLOUD_LOCATION='us-central1'
Luego, inicialice el cliente simplemente con:
client = genai.Client()
Casos de uso de Google Gen Ai Python SDK
Estas son las diversas formas en que puede usar las capacidades de Google Gen Ai Python SDK para usar una vez configurado.
Engendramiento de contenido
La función principal del SDK es difundir contenido de IA. Proporciona indicaciones en varias formas, como cadenas simples, contenido estructurado o entradas multimodales complejas.
Engendramiento de texto nuclear
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents="Why Does the sun rises from east"
)
print(response.text)
Producción

Esto envía un mensaje al maniquí y devuelve la respuesta generada.
Entradas de contenido estructurado
Puede insertar contenido estructurado en varios roles, como el agraciado o el maniquí para contextos de chatbot, conversación o múltiples giros.
from google.genai import types
content = types.Content(
role="user",
parts=(types.Part.from_text(text="Tell me a fun fact about work."))
)
response = client.models.generate_content(model="gemini-2.0-flash-001", contents=content)
print(response.text)
Producción

El SDK traduce internamente muchos tipos de entrada diferentes a un formato de datos estructurados para el maniquí.
Carga y uso de archivos
La API de Gemini Developers le permite cargar archivos para que el maniquí procese. Esto es ideal para resumir o cuna de contenido:
file = client.files.upload(file="/content/sample_file.txt")
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents=(file, 'Please summarize this file.')
)
print(response.text)
Producción

Este es un enfoque ideal para sumar funcionalidad de IA a tareas basadas en documentos.
Funciones llamadas
Una capacidad única es la capacidad de advenir las funciones de Python como «herramientas» para que el maniquí invoque automáticamente al difundir la finalización.
def get_current_weather(location: str) -> str:
return 'sunny'
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents="What is the weather like in Ranchi?",
config=types.GenerateContentConfig(tools=(get_current_weather))
)
print(response.text)
Producción

Esto permite la integración dinámica de datos en tiempo verdadero internamente de las respuestas de IA.
Configuración destacamento
Tiene la capacidad de personalizar la gestación con parámetros como temperatura, max_output_tokens y configuraciones de seguridad para dirigir la aleatoriedad, la distancia y el filtro de contenido dañino.
config = types.GenerateContentConfig(
temperature=0.3,
max_output_tokens=100,
safety_settings=(types.SafetySetting(category='HARM_CATEGORY_HATE_SPEECH', threshold='BLOCK_ONLY_HIGH'))
)
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents=""'Offer some encouraging words for someone starting a new journey.''',
config=config
)
print(response.text)
Producción

Esto puede proporcionar granularidad sobre la calidad y seguridad del contenido.
Soporte multimedia: imágenes y videos
El SDK le permite difundir y editar imágenes y difundir videos (en pinta previa).
- Genere imágenes utilizando indicaciones de texto.
- De opulencia o ajuste las imágenes generadas.
- Genere videos a partir de texto o imágenes.
Ejemplo de gestación de imágenes:
response = client.models.generate_images(
model="imagen-3.0-generate-002",
prompt="A tranquil beach with crystal-clear water and colorful seashells on the shore.",
config=types.GenerateImagesConfig(number_of_images=1)
)
response.generated_images(0).image.show()
Producción

Ejemplo de gestación de videos:
import time
operation = client.models.generate_videos(
model="veo-2.0-generate-001",
prompt="A cat DJ spinning vinyl records at a futuristic nightclub with holographic beats.",
config=types.GenerateVideosConfig(number_of_videos=1, duration_seconds=5)
)
while not operation.done:
time.sleep(20)
operation = client.operations.get(operation)
video = operation.response.generated_videos(0).video
video.show()
Producción:
Esto permite aplicaciones creativas de IA multimodal.
Chat y conversaciones
Puede comenzar las sesiones de chat que preservan el contexto a lo derrochador de sus mensajes:
chat = client.chats.create(model="gemini-2.0-flash-001")
response = chat.send_message('Tell me a story')
print(response.text)

response = chat.send_message('Summarize that story in one sentence')
print(response.text)

Esto es útil para crear una IA conversacional que recuerde el diálogo susodicho.
Soporte asíncrono
Todos los métodos de API principales tienen funciones de Async para una mejor integración en las aplicaciones Async Python:
response = await client.aio.models.generate_content(
model="gemini-2.0-flash-001",
contents="Tell a Horror story in 200 words."
)
print(response.text)

Conteo de tokens
Pistas de conteo de tokens cuántos tokens (piezas de texto) hay en su entrada. Esto le ayuda a permanecer internamente de los límites del maniquí y tomar decisiones rentables.
token_count = client.models.count_tokens(
model="gemini-2.0-flash-001",
contents="Why does the sky have a blue hue instead of other colors?"
)
print(token_count)

Incrustaciones
Los incrustaciones convierten su texto en vectores numéricos que representan su significado, que puede estar de moda para la búsqueda, la agrupación y la evaluación de IA.
embedding = client.models.embed_content(
model="text-embedding-004",
contents="Why does the sky have a blue hue instead of other colors?"
)
print(embedding)

Usando el SDK, puede contar fácilmente los tokens y hacer incrustaciones para mejorar y mejorar sus aplicaciones de IA.
Conclusión
El SDK de Google Gen Ai Python es una útil robusta y versátil que permite a los desarrolladores ceder a la parte superior de Google modelos de IA generativos En sus proyectos de Python. Desde la gestación de texto, el chat y el chatbot, hasta la gestación de imágenes/videos, llamadas de funciones y mucho más proporciona un conjunto de características robustas con interfaces simples. Con una instalación de paquete ligera, un proceso de configuración del cliente simple y soporte para la programación de async y multimedia, el SDK facilita la creación de aplicaciones que aprovechan significativamente la IA. Ya sea que sea un desarrollador principiante o experimentado, usar el SDK es relativamente indoloro pero poderoso cuando se prostitución de incorporar la IA generativa en sus flujos de trabajo.
Preguntas frecuentes
Es una biblioteca de Python para usar los servicios y modelos Gen AI de Google en el código Python
Ejecuta PIP Instalar Google-Genai. Si desea utilizar el SDK asíncronamente, ejecute PIP install Google-Genai (AIOHTTP).
En la creación del cliente, puede advenir una secreto API o establecer las variables de entorno GEMINI_API_KEY o establecer las credenciales de Google Cloud para Vertex AI.
Sí, el SDK puede realizar operaciones en lo que respecta a las imágenes y archivos, cargarlas y editarlas, y usarlas en contenido estructurado.
Generate_Content toma cadenas simples, listas de mensajes, indicaciones estructuradas donde asigna roles y contenido multipart (texto conexo con imágenes o archivos).
La función de llamadas de funciones permite que el maniquí llame a las funciones de Python dinámicamente durante la sesión. Por lo tanto, le permite tener un flujo de trabajo que llame a la dialéctica o computación externa.
Sí, en Generate_Content, puede usar el parámetro Generation_Config con argumentos como la temperatura (para controlar la aleatoriedad) y Max_output_Tokens (para prohibir la respuesta del maniquí).
Inicie sesión para continuar leyendo y disfrutando de contenido curado por expertos.