본문 바로가기

AI

(26)
ComfyUI 로 동영상 만들기 (Hunyuan gguf) 오픈소스 AI video에서 큰 관심을 끌고 있는 tencent의 HunyuanVideo 라고 하여 바로 따라해봤습니다. 우선 작업 중이라서 기록 https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/ ComfyUI 와 GGUF 커스텀 노드 전부 업데이트 해야 함아래 Youtube 참고 https://www.youtube.com/watch?v=CZKZIPGef6s https://www.cognibuild.ai/hunyuan-gguf-necessary-models      시키는데로 잘 하면 동영상 생성 성공~!!
가성비 AI 컴퓨터 조립 사양 (GPU 16G - ollama, comfyui 용 컴퓨터) 얼마전 PC 가 상태가 좋지 않아 컴퓨터를 알아보기 시작 했다.  Flux, StableDiffusion 등의 모델을 돌려보려면 최소 GPU 메모리가 16기가는 되어야 겠다고 생각 해서 이것 저것 알아보기 시작 했다.  그러나 역시 부족한 자금 사정사양은 높여야 겠고 예산은 한정되어 있으니 요래 저래 알아봐서 구매한 내용을 공유(본의 아니게 부품째 와서 직접 설치 까지ㅠㅠ) 내가 구매한 이력이다. PC견적 29871534CPU: AMD 라이젠5-4세대 7500F (정품) (멀티팩)208,460원 (1개)-거래완료PC견적 29871535쿨러/튜닝: JONSBO CR-1000 EVO AUTO RGB (블랙)25,530원 (1개)-거래완료PC견적 29871536메인보드: ASRock B650M PG Light..
Perplexity SKT 무료 (ChatGPT, Flux 무료) 유료로 사용하던 ChatGPT를 무료로 사용하는 방법이 생겼다.  SKT 고객만 가능, 1년 동안 무료!! 진짜 좋다. 아래 링크 통해서 가입하고 사용해 본다. ChatGPT 구독은 바로 해지 했다.  https://perplexity.sktadotevent.com/ SKT 에이닷 & Perplexity오직 SKT 고객만 누릴 수 있는 AI 혜택! Perplexity Pro를 1년간 무료로 이용하세요.perplexity.sktadotevent.com 설정에서 GPT-4o 를 고를 수가 있다.   그리고 요즘 이미지 생성 진짜 잘하는 Flux 도 무료로 사용이 가능하다.    요즘은 Flux 로 이미지 만들어서 회의자료에도 사용 한다. 이미지 생성은 영어로 만들어야 좀 더 잘 됨~  검색 말고 텍스트 생성..
Qwen2-VL 맥북에서 써보기 (M1 max) 맥북에서 Qwen2-VL 이미지 읽는 AI 를 사용해 봄이미지만 보여주고 생성한 Text 인데 2B 모델인데도 생각보다 잘 됐다. 모바일에 넣는 방법도 알아봐야겠다.     import torchfrom transformers import Qwen2VLForConditionalGeneration, AutoTokenizer, AutoProcessorfrom qwen_vl_utils import process_vision_infofrom PIL import Imagefrom pathlib import Pathimport sys# Toggle to switch between full response and extracted descriptionOUTPUT_FULL_RESPONSE = False# Ensure ..
한글 젤 잘 보는 이미지 모델 Qwen2-VL 며칠전 MS 의 phi-3.5-vision 을 써보고 이걸 개선 해야 겠다 싶었는데... 어마무시한 놈이 등장https://qwen2.org/vl/https://qwenlm.github.io/blog/qwen2-vl/ Qwen2-VL: To See the World More ClearlyDEMO GITHUB HUGGING FACE MODELSCOPE API DISCORD After a year’s relentless efforts, today we are thrilled to release Qwen2-VL! Qwen2-VL is the latest version of the vision language models based on Qwen2 in the Qwen model familities. Compa..
그림 제일 잘 그리는 AI - Flux 윈도우에 설치 요즘 가장 핫한 그림 그리는 AI 는 Flux 라고 하여 내 사양 낮은 컴터에서도 돌아가는지 설치~ 우선 ComfyUI  라는 Tool 설치 https://github.com/comfyanonymous/ComfyUI GitHub - comfyanonymous/ComfyUI: The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interfaceThe most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface. - comfyanonymous/ComfyUIgithub.com windows에 Direct L..
phi-3.5-vision 사용해 보기 (눈 달린 AI?) MS에서 좋은 모델이 나왔다길래 한번 사용해 봤다. https://www.aipostkorea.com/news/articleView.html?idxno=2220 MS 소형 언어모델 '파이-3'에 눈 달린다…차트·그래프 등 AI가 보고 답해마이크로소프트(MS)가 지난달 공개한 소형언어모델(SLM) 파이-3(Phi-3)에 비전(Vision) 기능을 추가했다. 이미지를 제공하면 AI가 자연어로 대답할 수 있게 됐다. 노트북이나 스마트폰 등 개인용 기기www.aipostkorea.com 가장 최근에 나온 모델로 Test~ https://huggingface.co/microsoft/Phi-3.5-vision-instruct/tree/main microsoft/Phi-3.5-vision-instruct at mai..
llama3.1 파인튜닝 퀵하게~ (with Colab) Unsloth 라는 기가막힌 라이브러리가 있다고 하여 바로 실행 해봤다.  아래 깃허브에서 원하는 모델 선택해서 Colab에서 바로 실행해 볼 수도 있음~!! https://github.com/unslothai/unsloth?tab=readme-ov-file GitHub - unslothai/unsloth: Finetune Llama 3.1, Mistral, Phi & Gemma LLMs 2-5x faster with 80% less memoryFinetune Llama 3.1, Mistral, Phi & Gemma LLMs 2-5x faster with 80% less memory - unslothai/unslothgithub.com 실제 실행해본 코드 첨부 해봅니다.  ## 필요 라이브러리 설치%%c..
프롬프트 잘 만들기 (Guide from 골빈해커!!) 프롬프트 잘 쓰기 핵심요소답변을 위해 필요한 컨텍스트 제공원하는 결과 추출을 위한 프롬프트 작성 (얻고자 하는 정보나 작업의 목표를 명확히 담은 질문이나 요청)결과물의 형식 지정프롬프트 디자인 프레임워크Role (역할)Audience (대상)Knowledge / Information (지식/정보)Task / Goal (작업 / 목표)Policy / Rule, Style, Constraint (정책 / 규칙, 스타일, 제약사항) Formal / Structure (형식/구조)Example (예시)프롬프팅 테크닉 관련 논문 연결 (책에 없는 링크도 찾음)예시제공 Few Shots https://arxiv.org/abs/2005.14165CoT:Chain of Though 생각 사슬https://arxiv.o..
한글 더 잘하는 llama3 찾아서 ollama에 연결하기 (feat. Bllossom ELO) 최근 Bllossom 팀에서 더 많은 Data로 학습한 모델을 올려주셔서 다시 한번 테스트 해본 내용을 작성하였다. (오늘은 2024-07-10 입니다.) https://huggingface.co/MLP-KTLim/llama-3-Korean-Bllossom-8B MLP-KTLim/llama-3-Korean-Bllossom-8B · Hugging FaceUpdate! [2024.06.18] 사전학습량을 250GB까지 늘린 Bllossom ELO모델로 업데이트 되었습니다. 다만 단어확장은 하지 않았습니다. 기존 단어확장된 long-context 모델을 활용하고 싶으신분은 개인연락주세요!huggingface.co 4bit 양자화 모델도 따로 올려주셔서 그 모델을 ollama에 연결하고 Flowise까지 연결해..