【大模型入门4】通过spring AI实现java调用本地大模型

admin

102755
文章

87
评论

2024年4月19日21:19:44评论8 views字数 3854阅读12分50秒阅读模式

在国内大家对数据隐私看的很重，这点从私有云和混合云占据半壁江山就能看得出来了，想要大模型应用场景落地是离不开本地部署大模型的。这篇文章简单介绍下怎么用java调用本地大模型。

—

前置知识

在前面的文章中已经介绍了怎么在本地通过ollama运行本地大模型了，再此就不再赘述。假设你已经在本地启动ollama服务了。

—

spring AI调用ollama

工程沿用上一篇文章中的demo工程，首先在application.yml中增加ollama的地址配置和模型名称

spring:  # spring ai模块  ai:    ollama:      base-url: http://127.0.0.1:11434      chat:        model: qwen1-7b

controller代码如下

package com.example.demo.controller;import com.example.demo.service.OllamaService;import jakarta.servlet.http.HttpServletResponse;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.web.bind.annotation.RequestMapping;import org.springframework.web.bind.annotation.RestController;import org.springframework.web.servlet.mvc.method.annotation.SseEmitter;@RestController@RequestMapping("/ollamaApi")public class OllamaController {    @Autowired    private OllamaService ollamaService;    @RequestMapping("/chat")    public String chat(){        return ollamaService.chat();    }    @RequestMapping("/stream")    public SseEmitter stream(HttpServletResponse response){        return ollamaService.stream(response);    }}

service代码如下

package com.example.demo.service.impl;import cn.hutool.core.collection.CollUtil;import cn.hutool.core.map.MapUtil;import com.example.demo.service.OllamaService;import jakarta.servlet.http.HttpServletResponse;import lombok.extern.slf4j.Slf4j;import org.apache.commons.lang3.StringUtils;import org.springframework.ai.chat.Generation;import org.springframework.ai.chat.messages.AssistantMessage;import org.springframework.ai.chat.messages.Message;import org.springframework.ai.chat.messages.UserMessage;import org.springframework.ai.chat.prompt.Prompt;import org.springframework.ai.chat.prompt.SystemPromptTemplate;import org.springframework.ai.ollama.OllamaChatClient;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.stereotype.Service;import org.springframework.web.servlet.mvc.method.annotation.SseEmitter;import java.util.List;@Slf4j@Servicepublic class OllamaServiceImpl implements OllamaService {    @Autowired    private OllamaChatClient ollamaChatClient;    @Override    public String chat() {        String systemPrompt = "{prompt}";        SystemPromptTemplate systemPromptTemplate = new SystemPromptTemplate(systemPrompt);        String userPrompt = "中国有哪些名胜古迹？";        Message userMessage = new UserMessage(userPrompt);        Message systemMessage = systemPromptTemplate.createMessage(MapUtil.of("prompt", "you are a helpful AI assistant"));        Prompt prompt = new Prompt(List.of(userMessage, systemMessage));        List<Generation> response = ollamaChatClient.call(prompt).getResults();        String result = "";        for (Generation generation : response){            String content = generation.getOutput().getContent();            result += content;        }        System.out.println(result);        return result;    }    @Override    public SseEmitter stream(HttpServletResponse response) {        response.setContentType("text/event-stream");        response.setCharacterEncoding("UTF-8");        SseEmitter emitter = new SseEmitter();        String systemPrompt = "{prompt}";        SystemPromptTemplate systemPromptTemplate = new SystemPromptTemplate(systemPrompt);        String userPrompt = "中国有哪些名胜古迹？";        Message userMessage = new UserMessage(userPrompt);        Message systemMessage = systemPromptTemplate.createMessage(MapUtil.of("prompt", "you are a helpful AI assistant"));        Prompt prompt = new Prompt(List.of(userMessage, systemMessage));        ollamaChatClient.stream(prompt).subscribe(x -> {            try {                log.info("response: {}",x);                List<Generation> generations = x.getResults();                if(CollUtil.isNotEmpty(generations)){                    for(Generation generation:generations){                        AssistantMessage assistantMessage =  generation.getOutput();                        String content = assistantMessage.getContent();                        if(StringUtils.isNotEmpty(content)){                            emitter.send(content);                        }else{                            if(StringUtils.equals(content,"null"))                                emitter.complete(); // Complete the SSE connection                        }                    }                }            } catch (Exception e) {                emitter.complete();                log.error("流式返回结果异常",e);            }        });        return emitter;    }}

—

完整代码

完整代码后台回复springai免费获取，获取到项目代码后找到DemoApplication类，右键运行，服务端口为8080。启动后使用工具调用接口即可运行

http://localhost:8080/ollamaApi/chathttp://localhost:8080/ollamaApi/stream

【大模型入门4】通过spring AI实现java调用本地大模型

原文始发于微信公众号（AI与网安）：【大模型入门4】通过spring AI实现java调用本地大模型

左青龙
微信扫一扫

右白虎
微信扫一扫

【大模型入门4】通过spring AI实现java调用本地大模型

[AI安全论文] (32)南洋理工大学刘杨教授——网络空间安全和AIGC整合之道学习笔记及强推（InForSec）

AI安全白皮书 - 华为

人工智能硬件安全白皮书 - DUEROS百度安全

owasp大模型应用威胁视图理解大模型应用目前所面临的主要安全威胁

《生成式人工智能数据应用合规指南》正式发布，5月1日实施

如何利用关键 Ray 框架漏洞来入侵全球 AI 机器？

[译文] LLM安全：1.黑客如何读取您与ChatGPT或微软Copilot的聊天内容

实战解读：Llama 3 安全性对抗分析

观点 | 视频生成人工智能Sora的法律问题研究

Google如何利用生成式AI加速事件响应流程

发表评论

在线咨询

微信