10 ผลิตภัณฑ์ AI ใหม่ประจำสัปดาห์นี้ 2024 1101

อุตสาหกรรมปัญญาประดิษฐ์ (AI) กำลังเปลี่ยนแปลงและพัฒนาอย่างรวดเร็ว เราได้เห็นความก้าวหน้าที่น่าทึ่งและผลิตภัณฑ์นวัตกรรมที่ขยายขอบเขตของสิ่งที่เราคิดว่าเป็นไปได้

เราได้ส่งมอบผลิตภัณฑ์ที่น่าประทับใจและล้ำสมัยซึ่งพร้อมที่จะปฏิวัติวงการต่างๆ และเพิ่มผลผลิตส่วนบุคคลในสัปดาห์นี้

สารบัญ

OpenAI เปิดตัวการค้นหาเว็บ ChatGPT อย่างเป็นทางการแล้ว

OpenAI ได้เปิดตัวอย่างเป็นทางการแล้ว ค้นหาเว็บ ChatGPT ฟีเจอร์นี้ค้นหาผลลัพธ์การค้นหาพร้อมลิงก์เว็บที่เกี่ยวข้องได้อย่างรวดเร็วและแบบเรียลไทม์ คุณไม่จำเป็นต้องใช้ส่วนขยายเว็บหรือแอปอื่น ๆ เพื่อใช้ฟีเจอร์นี้อีกต่อไป

คำตอบในการค้นหาทั้งหมดจะรวมการอ้างอิงแหล่งที่มาด้วย ChatGPT จะให้คำตอบที่เจาะลึกยิ่งขึ้นด้วยการรวมบริบทลงในคำค้นหา

นอกจากนี้ การดาวน์โหลดส่วนขยายเบราว์เซอร์ Chrome จะทำให้ ChatGPT กลายเป็นเครื่องมือค้นหาเริ่มต้นได้ วิธีนี้จะช่วยให้คุณใช้งานได้อย่างรวดเร็วและโดยตรง!

วิธีการใช้งาน ค้นหาเว็บ ChatGPT คุณสมบัตินี้หากคุณไม่ใช่สมาชิก ChatGPT Plus

OpenAI ได้ประกาศว่า ChatGPT Search สามารถเข้าถึงได้เฉพาะผู้ใช้ ChatGPT Plus และ Team เท่านั้น ซึ่งสามารถใช้งานได้ทันที ผู้ใช้ที่ชำระเงินไม่จำเป็นต้องรอสักพัก

อย่างไรก็ตาม OpenAI วางแผนที่จะเปิดตัวการเข้าถึงให้กับผู้ใช้ฟรีในอีกไม่กี่เดือนข้างหน้านี้

รอการเปิดตัว:หากคุณไม่ได้เป็นสมาชิกแบบชำระเงิน คุณต้องรอให้ OpenAI ขยายฟีเจอร์ดังกล่าวให้กับผู้ใช้ฟรี ซึ่งคาดว่าจะมีขึ้นในอีกไม่กี่เดือนข้างหน้านี้

เข้าร่วมรายชื่อรอ:หากมี โปรดพิจารณาเข้าร่วมรายชื่อรอที่ OpenAI อาจมอบให้เพื่อเข้าใช้งานฟีเจอร์ต่างๆ เช่น ChatGPT Search ก่อนใคร

ตรวจสอบเป็นประจำ:ติดตามประกาศจาก OpenAI เกี่ยวกับการอัปเดตว่าฟีเจอร์การค้นหาจะพร้อมใช้งานสำหรับผู้ใช้ฟรีเมื่อใด

ChatGPT รับประกันความถูกต้องของผลการค้นหาบนเว็บได้อย่างไร

ChatGPT รับประกันความถูกต้องของผลการค้นหาโดยใช้หลายวิธี:

การดึงข้อมูลแบบเรียลไทม์:เข้าถึงข้อมูลที่ทันสมัยผ่านทางเครื่องมือค้นหา รวบรวมเนื้อหาจากแหล่งที่น่าเชื่อถือและอ้างอิงถึงแหล่งเหล่านั้น

เกณฑ์การคัดเลือก:ChatGPT ให้ความสำคัญกับแหล่งที่มาที่มีความเกี่ยวข้อง เชื่อถือได้ และล่าสุดเพื่อให้ตรงกับคำถามของผู้ใช้
การปรับแต่งการค้นหา:หากขาดผลลัพธ์เบื้องต้น ระบบจะปรับปรุงแบบสอบถามเพื่อปรับปรุงความเกี่ยวข้อง
ความคิดเห็นของผู้ใช้:จะปรับเปลี่ยนตามการแก้ไขของผู้ใช้เพื่อปรับปรุงการตอบสนองในระยะยาว

HeyGen เปิดตัวฟีเจอร์ใหม่เพื่อสร้างมนุษย์ดิจิทัล

HeyGen เปิดตัวฟีเจอร์ใหม่ที่ให้ผู้ใช้สามารถสร้างมนุษย์ดิจิทัลโดยใช้เพียงรูปถ่ายโดยไม่ต้องถ่ายทำ

คุณสามารถอัปโหลดรูปถ่ายของคุณเองหรือป้อนข้อความเพื่อสร้างภาพตัวละครเสมือนจริง ซึ่งสามารถนำไปใช้ฝึกอวตารดิจิทัลวิดีโอ AI ของคุณเองได้

ยิ่งคุณอัพโหลดภาพอ้างอิงของตัวละครมากเท่าใด ความสอดคล้องของลักษณะใบหน้าในภาพที่สร้างขึ้นก็จะมากขึ้นเท่านั้น

มนุษย์ดิจิทัลเหล่านี้มีการเคลื่อนไหวร่างกายที่เป็นธรรมชาติ เสื้อผ้าที่ปรับแต่งได้ ท่าทาง และพื้นหลังที่สลับเปลี่ยนได้ และคุณยังเลือกเพศ อายุ และชาติพันธุ์ได้อีกด้วย

คุณสามารถแก้ไขสคริปต์ เลือกเสียงและการแสดงออกทางอารมณ์ที่แตกต่างกัน และสร้างวิดีโอได้อย่างรวดเร็วภายในเวลาอันสั้น

ซูโนะได้เปิดตัว Personas แล้ว

ซูโน่ ได้เปิดตัวฟีเจอร์ใหม่ที่เรียกว่า Personas

มันช่วยให้ผู้ใช้สามารถบันทึกคุณลักษณะหลักของเพลง เช่น เสียงร้อง สไตล์ และบรรยากาศ ซึ่งสามารถนำไปใช้ซ้ำในผลงานสร้างสรรค์ใหม่ได้

คุณสมบัตินี้ได้รับการออกแบบมาเพื่อช่วยให้คุณรักษาสไตล์ดนตรีอันเป็นเอกลักษณ์ของคุณไว้ได้

วิธีสร้าง Persona: เลือกเพลงที่คุณชอบ คลิก "สร้าง" จากนั้นสร้าง Persona เพิ่มเนื้อเพลงและรูปแบบ: ผู้ใช้สามารถเพิ่มเนื้อเพลงและรูปแบบได้เช่นเดียวกับการสร้างสรรค์ปกติ

การตั้งค่าสาธารณะและส่วนตัว: คุณสามารถเลือกตั้งค่า Persona เป็นสาธารณะหรือส่วนตัวได้ Persona สาธารณะจะมีหน้าของตัวเอง ซึ่งผู้ใช้คนอื่นสามารถใช้ได้ และจะปรากฏในห้องสมุดและโปรไฟล์ส่วนตัวของคุณ

GitHub แนะนำโมเดล AI เพิ่มเติมใน GitHub Copilot

GitHub ได้ประกาศว่าจะนำโมเดล AI เพิ่มเติมเข้ามาใน GitHub Copilot เพื่อเพิ่มตัวเลือกและความสามารถในการปรับแต่งสำหรับนักพัฒนา

โมเดลใหม่มีดังนี้:

คล็อด 3.5 โซเน็ต
เจมินี่ 1.5 โปร
o1-preview และ o1-mini

นอกจากนี้ GitHub ยังเปิดตัว GitHub Spark ซึ่งเป็นเครื่องมือสำหรับสร้างแอปพลิเคชันด้วยภาษาธรรมชาติโดยเฉพาะ

คุณไม่จำเป็นต้องรู้เทคนิคการปรับใช้ที่ซับซ้อน เช่น การกำหนดค่าเซิร์ฟเวอร์หรือฐานข้อมูล

GitHub Spark จะดำเนินการตั้งค่าคลาวด์และจัดสรรทรัพยากรทั้งหมดโดยอัตโนมัติในเบื้องหลัง ช่วยให้แม้แต่ผู้เริ่มต้นก็สามารถสร้างแอปพลิเคชันเว็บโดยใช้ภาษาธรรมชาติได้

กล่าวอีกนัยหนึ่ง คุณเพียงแค่บอกว่า “คุณต้องการทำอะไร” จากนั้นระบบจะจัดทำแอปที่มีฟังก์ชันใช้งานได้จริงให้กับคุณ ทำให้ขั้นตอนต่างๆ ง่ายดายเหมือนการสนทนาเลยทีเดียว

Stability AI ได้เปิดตัวโมเดล Stable Diffusion 3.5 Medium แล้ว

มีให้ใช้งานฟรีทั้งสำหรับผู้ใช้เชิงพาณิชย์และไม่ใช่เชิงพาณิชย์ โดยมีโมเดลพารามิเตอร์ 2.5 พันล้านตัว ซึ่งได้รับการออกแบบมาโดยเฉพาะสำหรับฮาร์ดแวร์ของผู้บริโภค

รุ่นนี้ต้องการ VRAM เพียง 9.9 GB เท่านั้น และสามารถทำงานบนการ์ดจอมาตรฐานส่วนใหญ่ที่มีฮาร์ดแวร์สำหรับผู้บริโภคทั่วไปได้

สามารถสร้างภาพคุณภาพสูงในความละเอียดหลายระดับ ให้ผลลัพธ์ที่เหนือกว่ารุ่นขนาดกลางอื่นๆ

ตามการวิเคราะห์ของ Stability AI พบว่า Stable Diffusion 3.5 Large เป็นผู้นำตลาดในด้านการปฏิบัติตามอย่างรวดเร็วและแข่งขันกับรุ่นที่ใหญ่กว่ามากในด้านคุณภาพของภาพ

วิธีใช้ Stable Diffusion 3.5?

ขั้นตอนการติดตั้งสำหรับการใช้งานในพื้นที่

ตอนนี้คุณสามารถดาวน์โหลดรุ่น Stable Diffusion 3.5 Large และ Stable Diffusion 3.5 Large Turbo ได้จาก กอดหน้า และโค้ดอนุมานบน GitHub. แล้วคุณสามารถรันมันบนคอมพิวเตอร์หรือฮาร์ดแวร์อื่นๆ ของคุณได้

ก่อนที่คุณจะสามารถรันบนคอมพิวเตอร์ได้ คุณควรตั้งค่าข้อกำหนดเบื้องต้นและติดตั้งไลบรารีที่จำเป็น

ในขณะที่คุณติดตั้ง Required Python Libraries คุณสามารถรัน Stable Diffusion Locally ได้

การเข้าถึงออนไลน์

การใช้ ComfyUI

ComfyUI นำเสนออินเทอร์เฟซที่ใช้งานง่ายสำหรับจัดการเวิร์กโฟลว์ของคุณด้วย Stable Diffusion 3.5 คุณสามารถลากไฟล์ต่างๆ ลงในอินเทอร์เฟซและเรียกใช้งานการสร้างภาพได้อย่างง่ายดาย

การใช้พื้นที่ใบหน้ากอดกัน

เยี่ยมชม Hugging Face Spaces เพื่อเรียกใช้ Stable Diffusion models โดยตรงในเบราว์เซอร์ของคุณโดยไม่ต้องติดตั้ง

สำหรับผู้ใช้จำนวนมากขึ้น แอปและเว็บไซต์ต่างๆ มากมายจะรวมโมเดล Stable Diffusion 3.5 รุ่นล่าสุดสำหรับการสร้างภาพในเร็วๆ นี้ โปรดติดตามข่าวสารอัปเดต!

Ultralight-Digital-Human: โมเดลมนุษย์ดิจิทัลน้ำหนักเบามากที่สามารถทำงานบนโทรศัพท์มือถือได้

อุลตร้าไลท์-ดิจิตอล-ฮิวแมน:โมเดลมนุษย์ดิจิทัลน้ำหนักเบามากที่รองรับการทำงานแบบเรียลไทม์บนอุปกรณ์เคลื่อนที่

อัลกอริทึมของโมเดลได้รับการปรับให้เหมาะสมเพื่อให้ทำงานได้อย่างราบรื่น แม้ในอุปกรณ์ที่ใช้พลังงานต่ำ
ใช้เวลาเพียง 3 ถึง 5 นาทีในการดูวิดีโอเพื่อให้การฝึกอบรมเสร็จสมบูรณ์

ตรวจสอบให้แน่ใจว่าทุกเฟรมของวิดีโอมีใบหน้าของบุคคลนั้นปรากฏให้เห็นเต็มๆ และเสียงก็ชัดเจนโดยไม่มีเสียงรบกวนใดๆ ใส่ไว้ในโฟลเดอร์ใหม่

นอกจากนี้ ด้วยการไหลของข้อมูลและกระบวนการอนุมานที่ได้รับการปรับให้เหมาะสม โมเดลสามารถประมวลผลข้อมูลอินพุต (เช่น วิดีโอและเสียง) แบบเรียลไทม์ ช่วยให้สามารถตอบสนองแบบดิจิทัลของมนุษย์ได้ทันที

การ แพลตฟอร์มวิดีโอ AI D-ID เปิดตัวเครื่องมือดิจิทัลสำหรับมนุษย์ใหม่

D-ID แพลตฟอร์มวิดีโอ AI เปิดตัวสองรายการใหม่ เครื่องมือดิจิทัลของมนุษย์—Express และ Premium+ ได้รับการออกแบบมาโดยเฉพาะสำหรับการสร้างเนื้อหา โดยมุ่งเน้นที่การเปิดโอกาสให้ธุรกิจสามารถนำมนุษย์เสมือนจริงที่สมจริงมากขึ้นไปประยุกต์ใช้ในด้านต่างๆ เช่น การตลาด การขาย และการสนับสนุนลูกค้า

มนุษย์เสมือน Express ต้องใช้เวลาสร้างการฝึกวิดีโอเพียงหนึ่งนาที และสามารถซิงโครไนซ์กับการเคลื่อนไหวศีรษะของผู้ใช้ได้

มนุษย์เสมือนจริงแบบ Premium+ ต้องใช้วิดีโอการฝึกที่ยาวกว่า แต่สามารถเคลื่อนไหวมือและลำตัวได้ ซึ่งทำให้มีปฏิสัมพันธ์ระหว่างมนุษย์ได้สมจริงมากขึ้น

เครื่องมือเหล่านี้ช่วยให้สร้างวิดีโอมนุษย์เสมือนจริงได้ง่ายยิ่งขึ้น ลดต้นทุนทางธุรกิจในการทำการตลาด และมีการใช้งานที่ครอบคลุมมากขึ้น

Google Gemini API ได้เปิดตัว “Search Anchoring”

Google เปิดตัวฟีเจอร์ใหม่ “Google Search Anchoring” ใน Gemini API และ Google AI Studio ซึ่งใช้งานง่ายมาก

ฟีเจอร์นี้ใช้ประโยชน์จากข้อมูลเรียลไทม์จาก Google Search เพื่อให้ผู้ใช้ได้รับข้อมูลที่แม่นยำและเป็นปัจจุบันมากขึ้น พร้อมด้วยลิงก์สนับสนุนและคำแนะนำในการค้นหา ทำให้การตอบกลับของ AI เชื่อถือได้มากขึ้น

การใช้ข้อมูลข่าวสารล่าสุดที่ได้จากการค้นหาช่วยลดข้อมูลที่ผิดพลาด
การค้นหาแบบเรียลไทม์จะดึงข้อมูลล่าสุดซึ่งช่วยให้ได้คำตอบที่ดีขึ้นในผลการค้นหาบางรายการ

คำตอบจะรวมลิงก์ไปยังแหล่งที่มาของข้อมูลไว้ด้วย เพื่อให้ผู้ใช้ตรวจสอบความน่าเชื่อถือของข้อมูลได้ง่ายขึ้น

คล็อดสำหรับเดสก์ท็อป

แอนโทรปิกเอไอ ได้สร้างแอปเดสก์ท็อป Claude แล้ว! ตอนนี้คุณสามารถใช้ได้ทั้งบน Mac และ Windows

เป็นของคุณ ผู้ช่วย AIคล็อดสามารถช่วยให้คุณทำงานที่ลึกซึ้งได้รวดเร็วและสร้างสรรค์มากยิ่งขึ้น

ตอนนี้คุณสามารถใช้ Claude ได้บนอุปกรณ์ใดก็ได้ สนทนากับ Claude และให้ Claude ช่วยคุณค้นหาคำตอบสำหรับคำถาม และวิเคราะห์เนื้อหาของรูปภาพได้

คล็อดได้เรียนรู้การทำความเข้าใจแผนภูมิและกราฟในไฟล์ PDF แล้ว!

Anthropic กำลังเปิดตัวความสามารถในการส่ง PDF ของ Claude ใน Anthropic API
ด้วยการสนับสนุน PDF เวอร์ชันเบต้าใหม่ คุณสามารถรวม PDF ลงในคำขอ API ของคุณได้โดยตรง การอ่านเอกสารวิจัยเป็นเรื่องง่ายขึ้นแล้ว

ตอนนี้โมเดล Sonnet Claude 3.5 ใหม่รองรับอินพุต PDF และเข้าใจทั้งข้อความและเนื้อหาภาพในเอกสาร

คุณสามารถสัมผัสคุณสมบัตินี้ได้ในตัวอย่างคุณสมบัติ

คุณสามารถถามคำถามเฉพาะใดๆ ที่คุณต้องการเกี่ยวกับเนื้อหาใน PDF และ Claude สามารถตอบคำถามของคุณได้โดยอิงจากความสามารถในการอ่านรูปภาพ

การรองรับ PDF ทำงานอย่างไร?

ระบบจะทำการแปลงไฟล์ PDF แต่ละหน้าให้เป็นรูปภาพ
ระบบจะเข้าใจ PDF ได้ดียิ่งขึ้นโดยการวิเคราะห์ข้อความและรูปภาพ
สามารถใช้ฟีเจอร์อื่นๆ ของ Claude พร้อมๆ กันได้

ฉันจะเปิดใช้งานฟีเจอร์ Visual PDF ใน Claude ได้อย่างไร

หากต้องการเปิดใช้งานฟีเจอร์ PDF แบบภาพใน Claude ให้ทำตามขั้นตอนเหล่านี้:

เข้าถึงการตั้งค่า:
เปิดอินเทอร์เฟซ Claude และมองหาไอคอนขวดหรือเมนูการตั้งค่า
เปิดใช้งาน PDF แบบภาพ:
คลิกที่ไอคอนขวดแก้ว ไปที่ตัวเลือก PDF แบบภาพ และเปิดใช้งาน วิธีนี้จะช่วยให้ Claude สามารถประมวลผลและตีความรูปภาพและองค์ประกอบภาพภายในเอกสาร PDF ได้
อัพโหลด PDF ของคุณ:
เมื่อเปิดใช้งานคุณสมบัติแล้ว คุณสามารถอัปโหลดเอกสาร PDF ได้โดยการลากไปยังหน้าต่างแชทหรือใช้ปุ่มอัปโหลด มันง่ายและสะดวกมาก
โต้ตอบกับคล็อด:
หลังจากอัปโหลดไฟล์ PDF แล้ว คุณสามารถถาม Claude เกี่ยวกับข้อความและรูปภาพที่อยู่ใน PDF ได้ ซึ่งจะทำให้การโต้ตอบกับเอกสารที่ซับซ้อนของคุณมีประสิทธิภาพมากขึ้น ซึ่งจะช่วยให้คุณอ่านเอกสารได้สะดวกขึ้นและเพิ่มประสิทธิภาพการทำงานของคุณ!