Spaces:

RAHMAN00700
/

chat_with_images_using_llama-3-2-90bvi

Sleeping

App Files Files Community

RAHMAN00700 commited on Dec 12, 2024

Commit

743982a

unverified ·

1 Parent(s): 04bd8d0

Create app1.py

Browse files

Files changed (1) hide show

app1.py +141 -0

app1.py ADDED Viewed

	@@ -0,0 +1,141 @@

+import streamlit as st
+import base64
+from PIL import Image
+import os
+from dotenv import load_dotenv
+import requests
+# Load environment variables
+load_dotenv()
+api_key = os.getenv("IBM_API_KEY")
+def convert_image_to_base64(uploaded_file):
+    """Convert uploaded image to Base64 format."""
+    bytes_data = uploaded_file.getvalue()
+    base64_image = base64.b64encode(bytes_data).decode()
+    return base64_image
+def get_auth_token(api_key):
+    """Retrieve authentication token using IBM API key."""
+    auth_url = "https://iam.cloud.ibm.com/identity/token"
+    headers = {
+        "Content-Type": "application/x-www-form-urlencoded",
+        "Accept": "application/json"
+    }
+    data = {
+        "grant_type": "urn:ibm:params:oauth:grant-type:apikey",
+        "apikey": api_key
+    }
+    response = requests.post(auth_url, headers=headers, data=data, verify=False)
+    if response.status_code == 200:
+        return response.json().get("access_token")
+    else:
+        raise Exception("Failed to get authentication token")
+def main():
+    st.title("Chat with Images")
+    # Initialize chat history and uploaded file state
+    if "messages" not in st.session_state:
+        st.session_state.messages = []
+    if "uploaded_file" not in st.session_state:
+        st.session_state.uploaded_file = None
+    # Clear uploaded image button
+    if st.session_state.uploaded_file:
+        if st.button("Clear Uploaded Image"):
+            st.session_state.uploaded_file = None
+            st.session_state.messages = []
+    # User input: Upload an image
+    uploaded_file = st.file_uploader("Choose an image...", type=["jpg", "jpeg", "png"])
+    if uploaded_file is not None:
+        st.session_state.uploaded_file = uploaded_file
+        image = Image.open(uploaded_file)
+        with st.chat_message("user"):
+            st.image(image, caption='Uploaded Image', use_container_width=True)
+            base64_image = convert_image_to_base64(uploaded_file)
+            st.session_state.messages.append({"role": "user", "content": [{"type": "image_url", "image_url": {"url": f"data:image/png;base64,{base64_image}"}}]})
+    # Display chat messages
+    for msg in st.session_state.messages[1:]:
+        if msg['role'] == "user":
+            with st.chat_message("user"):
+                if msg['content'][0]['type'] == "text":
+                    st.write(msg['content'][0]['text'])
+        else:
+            st.chat_message("assistant").write(msg["content"])
+    # User input: Chat message
+    user_input = st.chat_input("Type your message here...")
+    if user_input:
+        message = {"role": "user", "content": [{"type": "text", "text": user_input}]}
+        st.session_state.messages.append(message)
+        st.chat_message(message['role']).write(user_input)
+        # Prepare and send API request
+        url = "https://us-south.ml.cloud.ibm.com/ml/v1/text/chat?version=2023-05-29"
+        model_messages = []
+        latest_image_url = None
+        for msg in st.session_state.messages:
+            if msg["role"] == "user" and isinstance(msg["content"], list):
+                content = []
+                for item in msg["content"]:
+                    if item["type"] == "text":
+                        content.append(item)
+                    elif item["type"] == "image_url":
+                        latest_image_url = item
+                if latest_image_url:
+                    content.append(latest_image_url)
+                model_messages.append({"role": msg["role"], "content": content})
+            else:
+                model_messages.append({"role": msg["role"], "content": [{"type": "text", "text": msg["content"]}] if isinstance(msg["content"], str) else msg["content"]})
+        body = {
+            "messages": [model_messages[-1]],
+            "project_id": "833c9053-ef07-455e-819f-6557dea2f8bc",
+            "model_id": "meta-llama/llama-3-2-90b-vision-instruct",
+            "decoding_method": "greedy",
+            "repetition_penalty": 1,
+            "max_tokens": 900
+        }
+        try:
+            YOUR_ACCESS_TOKEN = get_auth_token(api_key)
+            headers = {
+                "Accept": "application/json",
+                "Content-Type": "application/json",
+                "Authorization": f"Bearer {YOUR_ACCESS_TOKEN}"
+            }
+            response = requests.post(
+                url,
+                headers=headers,
+                json=body
+            )
+            if response.status_code == 200:
+                res_content = response.json()['choices'][0]['message']['content']
+                if isinstance(res_content, list):
+                    res_content = " ".join([item.get("text", "") for item in res_content])
+                st.session_state.messages.append({"role": "assistant", "content": res_content})
+                with st.chat_message("assistant"):
+                    st.write(res_content)
+            else:
+                error_message = "Sorry, I couldn't process your request. Please try again later."
+                st.session_state.messages.append({"role": "assistant", "content": error_message})
+                with st.chat_message("assistant"):
+                    st.write(error_message)
+        except Exception as e:
+            st.error(f"An error occurred: {e}")
+if __name__ == "__main__":
+    main()