Spaces:

ndurner
/

oai_chat

Sleeping

App Files Files Community

ndurner commited on 14 days ago

Commit

1c05cb6

1 Parent(s): 90b6fdb

well-defined export files

Browse files

Files changed (4) hide show

README.md +1 -1
app.py +36 -55
chat_export.py +209 -0
requirements.txt +1 -1

README.md CHANGED Viewed

@@ -4,7 +4,7 @@ emoji: 🤖
 colorFrom: yellow
 colorTo: gray
 sdk: gradio
-sdk_version: 5.13.1
 app_file: app.py
 pinned: false
 license: mit

 colorFrom: yellow
 colorTo: gray
 sdk: gradio
+sdk_version: 5.7.1
 app_file: app.py
 pinned: false
 license: mit

app.py CHANGED Viewed

@@ -7,6 +7,7 @@ import fitz
 from PIL import Image
 import io
 from settings_mgr import generate_download_settings_js, generate_upload_settings_js
 from doc2json import process_docx
 from code_exec import eval_restricted_script
@@ -118,7 +119,8 @@ def encode_file(fn: str) -> list:
             user_msg_parts.append({"type": "image_url",
                                 "image_url":{"url": content}})
         else:
-            user_msg_parts.append({"type": "text", "text": content})
     return user_msg_parts
@@ -153,14 +155,15 @@ def bot(message, history, oai_key, system_prompt, seed, temperature, max_tokens,
         if model == "whisper":
             result = ""
             whisper_prompt = system_prompt
-            for human, assi in history:
-                if human is not None:
-                    if type(human) is tuple:
                         pass
                     else:
-                        whisper_prompt += f"\n{human}"
-                if assi is not None:
-                        whisper_prompt += f"\n{assi}"
             if message["text"]:
                 whisper_prompt += message["text"]
@@ -231,19 +234,24 @@ def bot(message, history, oai_key, system_prompt, seed, temperature, max_tokens,
                     role = "developer"
                 history_openai_format.append({"role": role, "content": system_prompt})
-            for human, assi in history:
-                if human is not None:
-                    if type(human) is tuple:
-                        user_msg_parts.extend(encode_file(human[0]))
                     else:
-                        user_msg_parts.append({"type": "text", "text": human})
-                if assi is not None:
                     if user_msg_parts:
                         history_openai_format.append({"role": "user", "content": user_msg_parts})
                         user_msg_parts = []
-                    history_openai_format.append({"role": "assistant", "content": assi})
             if message["text"]:
                 user_msg_parts.append({"type": "text", "text": message["text"]})
@@ -378,28 +386,16 @@ def bot(message, history, oai_key, system_prompt, seed, temperature, max_tokens,
     except Exception as e:
         raise gr.Error(f"Error: {str(e)}")
-def import_history(history, file):
-    with open(file.name, mode="rb") as f:
-        content = f.read()
-        if isinstance(content, bytes):
-            content = content.decode('utf-8', 'replace')
-        else:
-            content = str(content)
-    os.remove(file.name)
-    # Deserialize the JSON content
-    import_data = json.loads(content)
-    # Check if 'history' key exists for backward compatibility
-    if 'history' in import_data:
-        history = import_data['history']
-        system_prompt.value = import_data.get('system_prompt', '')  # Set default if not present
-    else:
-        # Assume it's an old format with only history data
-        history = import_data
-    return history, system_prompt.value  # Return system prompt value to be set in the UI
 with gr.Blocks(delete_cache=(86400, 86400)) as demo:
     gr.Markdown("# OAI Chat (Nils' Version™️)")
@@ -456,7 +452,7 @@ with gr.Blocks(delete_cache=(86400, 86400)) as demo:
         dl_settings_button.click(None, controls, js=generate_download_settings_js("oai_chat_settings.bin", control_ids))
         ul_settings_button.click(None, None, None, js=generate_upload_settings_js(control_ids))
-    chat = gr.ChatInterface(fn=bot, multimodal=True, additional_inputs=controls, autofocus = False)
     chat.textbox.file_count = "multiple"
     chat.textbox.max_plain_text_length = 2**31
     chatbot = chat.chatbot
@@ -472,24 +468,7 @@ with gr.Blocks(delete_cache=(86400, 86400)) as demo:
     with gr.Accordion("Import/Export", open = False):
         import_button = gr.UploadButton("History Import")
         export_button = gr.Button("History Export")
-        export_button.click(lambda: None, [chatbot, system_prompt], js="""
-            (chat_history, system_prompt) => {
-                const export_data = {
-                    history: chat_history,
-                    system_prompt: system_prompt
-                };
-                const history_json = JSON.stringify(export_data);
-                const blob = new Blob([history_json], {type: 'application/json'});
-                const url = URL.createObjectURL(blob);
-                const a = document.createElement('a');
-                a.href = url;
-                a.download = 'chat_history.json';
-                document.body.appendChild(a);
-                a.click();
-                document.body.removeChild(a);
-                URL.revokeObjectURL(url);
-            }
-            """)
         dl_button = gr.Button("File download")
         dl_button.click(lambda: None, [chatbot], js="""
             (chat_history) => {
@@ -544,7 +523,9 @@ with gr.Blocks(delete_cache=(86400, 86400)) as demo:
                 }
             }
         """)
-        import_button.upload(import_history, inputs=[chatbot, import_button], outputs=[chatbot, system_prompt])
 demo.unload(lambda: [os.remove(file) for file in temp_files])
 demo.queue(default_concurrency_limit = None).launch()

 from PIL import Image
 import io
 from settings_mgr import generate_download_settings_js, generate_upload_settings_js
+from chat_export import import_history, get_export_js
 from doc2json import process_docx
 from code_exec import eval_restricted_script
             user_msg_parts.append({"type": "image_url",
                                 "image_url":{"url": content}})
         else:
+            fn = os.path.basename(fn)
+            user_msg_parts.append({"type": "text", "text": f"```{fn}\n{content}\n```"})
     return user_msg_parts
         if model == "whisper":
             result = ""
             whisper_prompt = system_prompt
+            for msg in history:
+                content = msg["content"]
+                if msg["role"] == "user":
+                    if type(content) is tuple:
                         pass
                     else:
+                        whisper_prompt += f"\n{content}"
+                if msg["role"] == "assistant":
+                        whisper_prompt += f"\n{content}"
             if message["text"]:
                 whisper_prompt += message["text"]
                     role = "developer"
                 history_openai_format.append({"role": role, "content": system_prompt})
+            for msg in history:
+                role = msg["role"]
+                content = msg["content"]
+                if role == "user":
+                    if isinstance(content, gr.File) or isinstance(content, gr.Image):
+                        user_msg_parts.extend(encode_file(content.value['path']))
+                    elif isinstance(content, tuple):
+                        user_msg_parts.extend(encode_file(content[0]))
                     else:
+                        user_msg_parts.append({"type": "text", "text": content})
+                if role == "assistant":
                     if user_msg_parts:
                         history_openai_format.append({"role": "user", "content": user_msg_parts})
                         user_msg_parts = []
+                    history_openai_format.append({"role": "assistant", "content": content})
             if message["text"]:
                 user_msg_parts.append({"type": "text", "text": message["text"]})
     except Exception as e:
         raise gr.Error(f"Error: {str(e)}")
+def import_history_guarded(oai_key, history, file):
+    # check credentials first
+    try:
+        client = OpenAI(api_key=oai_key)
+        client.models.retrieve("gpt-4o")
+    except Exception as e:
+        raise gr.Error(f"OpenAI login error: {str(e)}")
+    # actual import
+    return import_history(history, file)
 with gr.Blocks(delete_cache=(86400, 86400)) as demo:
     gr.Markdown("# OAI Chat (Nils' Version™️)")
         dl_settings_button.click(None, controls, js=generate_download_settings_js("oai_chat_settings.bin", control_ids))
         ul_settings_button.click(None, None, None, js=generate_upload_settings_js(control_ids))
+    chat = gr.ChatInterface(fn=bot, multimodal=True, additional_inputs=controls, autofocus = False, type = "messages")
     chat.textbox.file_count = "multiple"
     chat.textbox.max_plain_text_length = 2**31
     chatbot = chat.chatbot
     with gr.Accordion("Import/Export", open = False):
         import_button = gr.UploadButton("History Import")
         export_button = gr.Button("History Export")
+        export_button.click(lambda: None, [chatbot, system_prompt], js=get_export_js())
         dl_button = gr.Button("File download")
         dl_button.click(lambda: None, [chatbot], js="""
             (chat_history) => {
                 }
             }
         """)
+        import_button.upload(import_history_guarded,
+                            inputs=[oai_key, chatbot, import_button],
+                            outputs=[chatbot, system_prompt])
 demo.unload(lambda: [os.remove(file) for file in temp_files])
 demo.queue(default_concurrency_limit = None).launch()

chat_export.py ADDED Viewed

	@@ -0,0 +1,209 @@

+import json
+import base64
+import os, io
+import mimetypes
+from PIL import Image
+import gradio as gr
+def import_history(history, file):
+    if os.path.getsize(file.name) > 100e6:
+        raise ValueError("History larger than 100 MB")
+    with open(file.name, mode="rb") as f:
+        content = f.read().decode('utf-8', 'replace')
+    import_data = json.loads(content)
+    # Handle different import formats
+    if 'messages' in import_data:
+        # New OpenAI-style format
+        messages = import_data['messages']
+        system_prompt_value = ''
+        chat_history = []
+        msg_num = 1
+        for msg in messages:
+            if msg['role'] == 'system':
+                system_prompt_value = msg['content']
+                continue
+            if msg['role'] == 'user':
+                content = msg['content']
+                if isinstance(content, list):
+                    for item in content:
+                        if item.get('type', '') == 'image_url':
+                            # Create gr.Image from data URI
+                            image_data = base64.b64decode(item['image_url']['url'].split(',')[1])
+                            img = Image.open(io.BytesIO(image_data))
+                            chat_history.append({
+                                "role": msg['role'],
+                                "content": gr.Image(value=img)
+                            })
+                        elif item.get('type', '') == 'file':
+                            # Handle file content with gr.File
+                            fname = os.path.basename(item['file'].get('name', f'download{msg_num}'))
+                            dir_path = os.path.dirname(file.name)
+                            temp_path = os.path.join(dir_path, fname)
+                            file_data = base64.b64decode(item['file']['url'].split(',')[1])
+                            if (len(file_data) > 15e6):
+                                raise ValueError(f"file content `{fname}` larger than 15 MB")
+                            with open(temp_path, "wb") as tempf:
+                                tempf.write(file_data)
+                            chat_history.append({
+                                "role": msg['role'],
+                                "content": gr.File(value=temp_path,
+                                                 label=fname)
+                            })
+                        else:
+                            chat_history.append(msg)
+                else:
+                    chat_history.append(msg)
+            elif msg['role'] == 'assistant':
+                chat_history.append(msg)
+            msg_num = msg_num + 1
+    else:
+        # Legacy format handling
+        if 'history' in import_data:
+            legacy_history = import_data['history']
+            system_prompt_value = import_data.get('system_prompt', '')
+        else:
+            legacy_history = import_data
+            system_prompt_value = ''
+        chat_history = []
+        # Convert tuple/pair format to messages format
+        for pair in legacy_history:
+            if pair[0]:  # User message
+                if isinstance(pair[0], dict) and 'file' in pair[0]:
+                    if 'data' in pair[0]['file']:
+                        # Legacy format with embedded data
+                        file_data = pair[0]['file']['data']
+                        mime_type = file_data.split(';')[0].split(':')[1]
+                        if mime_type.startswith('image/'):
+                            image_data = base64.b64decode(file_data.split(',')[1])
+                            img = Image.open(io.BytesIO(image_data))
+                            chat_history.append({
+                                "role": "user",
+                                "content": gr.Image(value=img)
+                            })
+                        else:
+                            fname = pair[0]['file'].get('name', 'download')
+                            dir_path = os.path.dirname(file.name)
+                            temp_path = os.path.join(dir_path, fname)
+                            file_data = base64.b64decode(file_data.split(',')[1])
+                            with open(temp_path, "wb") as tempf:
+                                tempf.write(file_data)
+                            chat_history.append({
+                                "role": "user",
+                                "content": gr.File(value=temp_path,
+                                                 label=fname)
+                            })
+                    else:
+                        # Keep as-is but convert to message format
+                        chat_history.append({
+                            "role": "user",
+                            "content": pair[0]
+                        })
+                else:
+                    chat_history.append({
+                        "role": "user",
+                        "content": pair[0]
+                    })
+            if pair[1]:  # Assistant message
+                chat_history.append({
+                    "role": "assistant",
+                    "content": pair[1]
+                })
+    return chat_history, system_prompt_value
+def get_export_js():
+    return """
+    async (chat_history, system_prompt) => {
+        let messages = [];
+        if (system_prompt) {
+            messages.push({
+                "role": "system",
+                "content": system_prompt
+            });
+        }
+        async function processFile(file_url) {
+            const response = await fetch(file_url);
+            const blob = await response.blob();
+            return new Promise((resolve) => {
+                const reader = new FileReader();
+                reader.onloadend = () => resolve({
+                    data: reader.result,
+                    type: blob.type
+                });
+                reader.onerror = (error) => resolve(null);
+                reader.readAsDataURL(blob);
+            });
+        }
+        for (let message of chat_history) {
+            if (!message.role || !message.content) continue;
+            if (message.content && typeof message.content === 'object') {
+                if (message.content.file) {
+                    try {
+                        const file_data = await processFile(message.content.file.url);
+                        if (!file_data) continue;
+                        if (file_data.type.startsWith('image/')) {
+                            messages.push({
+                                "role": message.role,
+                                "content": [{
+                                    "type": "image_url",
+                                    "image_url": {
+                                        "url": file_data.data
+                                    }
+                                }]
+                            });
+                        } else {
+                            const fileLink = document.querySelector(`a[data-testid="chatbot-file"][download][href*="${message.content.file.url.split('/').pop()}"]`);
+                            const fileName = fileLink ? fileLink.getAttribute('download') : (message.content.file.name || "download");
+                            messages.push({
+                                "role": message.role,
+                                "content": [{
+                                    "type": "file",
+                                    "file": {
+                                        "url": file_data.data,
+                                        "name": fileName,
+                                        "mime_type": file_data.type
+                                    }
+                                }]
+                            });
+                        }
+                    } catch (error) {}
+                }
+            } else {
+                messages.push({
+                    "role": message.role,
+                    "content": message.content
+                });
+            }
+        }
+        const export_data = { messages };
+        const blob = new Blob([JSON.stringify(export_data)], {type: 'application/json'});
+        const url = URL.createObjectURL(blob);
+        const a = document.createElement('a');
+        a.href = url;
+        a.download = 'chat_history.json';
+        document.body.appendChild(a);
+        a.click();
+        document.body.removeChild(a);
+        URL.revokeObjectURL(url);
+    }
+    """

requirements.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-gradio == 5.13.1
 openai == 1.60.1
 lxml
 PyMuPDF

+gradio == 5.7.1
 openai == 1.60.1
 lxml
 PyMuPDF