核心内容摘要
78号申请:当男孩眼中闪耀着女孩的光芒
在AI应用ä¸ç¼“å˜æœºåˆ¶çš„ç»�æµ�价值ä¸�仅节çœ�Tokenæˆ�本还能消除用户ç‰å¾…焦虑ã€�æ��å�‡ç³»ç»Ÿå��å��é‡�ã€�ä¿�éšœæœ�务稳定性——这æ‰�是ä¼�业级应用的真æ£ç—›ç‚¹ã€‚当用户æ��出一个常è§�问题时首次调用大模å�‹éœ€è¦�ç»�å�†ç½‘ç»œä¼ è¾“ã€�æ�’队ç‰å¾…ã€�模å�‹æ�¨ç�†ç‰å®Œæ•´é“¾è·¯å“�应时间通常在1至3秒。这个时长已超过人类对“æµ�畅交互â€�的心ç�†é˜ˆå€¼200毫秒用户会æ˜�显感知到“å�¡é¡¿â€�和“ç‰å¾…焦虑â€�。而å�¯ç”¨ç¼“å˜å��相å�Œé—®é¢˜çš„å��ç»è¯·æ±‚ç›´æ�¥ä»�本地数æ�®åº“读å�–结æ�œå“�应时间骤é™�至10毫秒以内——这ç§�â€œæ— æ„Ÿç§’å›�â€�的体验让用户感觉系统始终在线ã€�å��应迅æ�·æ��大æ��å�‡äº†äº§å“�专业度和信任感。下é�¢çœ‹çœ‹è¿™æ®µä»£ç �就能清晰的体ç�°ä½¿ç”¨ç¼“å˜å��能æ��å�‡çš„用户体验。å�Œä¸€ä¸ªé—®é¢˜é—®å¤§æ¨¡å�‹ä¸‰æ¬¡ç¬¬ä¸€æ¬¡æ²¡æœ‰ç¼“å˜å��两次有缓å˜import os import time from langchain_community.cache import SQLiteCache from langchain_openai import ChatOpenAI from langchain.globals import set_llm_cache, get_llm_cache #
清ç�†æ—§ç¼“å˜ç¡®ä¿�演示纯净 CACHE_DB langchain_demo.db if os.path.exists(CACHE_DB): os.remove(CACHE_DB) print(f 已清ç�†æ—§ç¼“å˜: {CACHE_DB}) #
å�¯ç”¨ç¼“å˜ set_llm_cache(SQLiteCache(database_pathCACHE_DB)) print(f 缓å˜å·²å�¯ç”¨: {get_llm_cache()}\n) #
é…�ç½® LLM llm ChatOpenAI( api_keyos.getenv(DEEPSEEK_API_KEY), base_urlos.getenv(DEEP_URL), # Deepseek çš„ API 基础地å�€ modeldeepseek-v3:671b, # Deepseek 对è¯�模å�‹å�¯é€‰deepseek-chat-pro ç‰é«˜çº§æ¨¡å�‹ temperature
7, # 温度�数
越�越稳定 max_tokens1024 # 最大生� tokens ) #
æ ¸å¿ƒæ¼”ç¤ºå‡½æ•° def demonstrate_cache_effect(query: str, repeat: int
: æ¼”ç¤ºç¼“å˜æ•ˆæ�œé¦–次调用慢 vs å��ç»è°ƒç”¨å¿« Args: query: è¦�æ��问的问题 repeat: é‡�å¤�调用次数第1次未缓å˜å��ç»åº”命ä¸ç¼“å˜ print( *
print(f 测试问题: \{query}\) print(f å°†é‡�å¤�调用 {repeat} 次第1æ¬¡æ— ç¼“å˜å��ç»åº”命ä¸ç¼“å˜) print( * 60 \n) durations [] for i in range(repeat): print(f\n[第 {i 1} 次调用]) start time.perf_counter() # 高精度计时 # 关键使用完全相å�Œçš„输入触å�‘ç¼“å˜ response llm.invoke(query) duration (time.perf_counter() - start) * 1000 # 转为毫秒 durations.append(duration) # åˆ¤æ–æ˜¯å�¦å‘½ä¸ç¼“å˜é€šè¿‡è€—æ—¶é˜ˆå€¼ç²—ç•¥åˆ¤æ– is_cached i 0 # 首次通常 500ms缓å˜é€šå¸¸ 50ms if i 0: print(缓å˜å‘½ä¸,耗时str(duration)) else: print(真å®�请求,耗时str(duration)) print(f å›�ç”: {response.content[:60]}...) #
执行演示 if __name__ __main__: # æµ‹è¯•æ ‡å‡†é—®é¢˜ç¡®ä¿�完全相å�Œçš„å—符串 demonstrate_cache_effect(太阳系哪个行星最大, repeat
è¿�行结æ�œå·²æ¸…ç�†æ—§ç¼“å˜: langchain_demo.db缓å˜å·²å�¯ç”¨: langchain_community.cache.SQLiteCache object at 0x000001D668B50410测试问题: 太阳系哪个行星最大将é‡�å¤�调用 3 次第1æ¬¡æ— ç¼“å˜å��ç»åº”命ä¸ç¼“å˜[第 1 次调用]真å®�请求,耗时
1
118000000093å›�ç”: å¤ªé˜³ç³»ä¸æœ€å¤§çš„行星是**木星**。以下是关äº�木星的一些关键信æ�¯### 木星的基本特å¾�
**体积ä¸�è´¨é‡�** ...[第 2 次调用]缓å˜å‘½ä¸,耗时
4