โปรไฟล์ข้อมูลและคำแนะนำด้านรูปแบบภาษา

เมื่อคุณสร้างชุดข้อมูล Oracle Analytics จะสร้างโปรไฟล์ระดับคอลัมน์ เพื่อสร้างชุดคำแนะนำเกี่ยวกับรูปแบบภาษาในการซ่อมแซมหรือเพิ่มความสมบูรณ์ให้กับข้อมูลของคุณ เมื่อคุณสร้างเวิร์กบุค คุณสามารถรวมการการเพิ่มความสมบูรณ์ของความรู้ลงในการแสดงข้อมูลของคุณได้เช่นกัน โดยการเพิ่มจากแผงข้อมูล

หมายเหตุ:

โดยปกติ การเพิ่มความสมบูรณ์ของความรู้จะทำงานตามค่าดีฟอลต์ แต่โปรแกรมแก้ไขเวิร์กบุคจะสามารถใช้งานหรือเลิกใช้คุณสมบัตินี้สำหรับชุดข้อมูลที่โปรแกรมแก้ไขเป็นเจ้าของ หรือมีสิทธิ์ในการแก้ไข Oracle Analytics จะไม่ให้คําแนะนําการเพิ่มความสมบูรณ์สําหรับชุดข้อมูลที่สร้างจากโฟลว์ข้อมูลโดยอัตโนมัติ ในกรณีนี้ เจ้าของชุดข้อมูลหรือผู้ดูแลระบบต้องใช้งานตัวเลือกการเพิ่มความสมบูรณ์ของความรู้สําหรับชุดข้อมูลก่อน โปรดดู ใช้งานการเพิ่มความสมบูรณ์ของความรู้สําหรับชุดข้อมูล

คำแนะนำเหล่านี้จะอ้างอิงการตรวจพบประเภทรูปแบบภาษาโดยอัตโนมัติของระบบในขั้นตอนกำหนดโปรไฟล์ ตัวอย่างเช่น ชุดข้อมูลที่อิงตามหัวเรื่องในระบบจะได้รับการสร้างโปรไฟล์โดยใช้ตัวอย่าง N สูงสุดแบบง่าย

ประเภทรูปแบบภาษามีหลายชนิด เช่น ตำแหน่งทางภูมิศาสตร์ที่ระบุตามชื่อเมือง, รูปแบบที่รับรู้ได้ที่ปรากฏในบัตรเครดิต อีเมล์แอดเดรส และเลขที่ประกันสังคม, วันที่ และรูปแบบการเกิดซ้ำ และคุณยังสร้างประเภทรูปแบบภาษาที่กำหนดเองได้ด้วย

ชนิดประเภทรูปแบบภาษา

การสร้างโปรไฟล์ใช้กับประเภทรูปแบบภาษาต่างๆ

มีการสร้างโปรไฟล์ชนิดประเภทรูปแบบภาษาเพื่อระบุข้อมูลดังนี้

  • ตำแหน่งทางภูมิศาสตร์ เช่น ชื่อเมือง
  • รูปแบบต่างๆ เช่น รูปแบบที่พบในหมายเลขบัตรเครดิตหรืออีเมล์แอดเดรส
  • รูปแบบการเกิดซ้ำ เช่น ข้อมูลวลีที่มีเครื่องหมายขีดกลาง

คำแนะนำของประเภทรูปแบบภาษา

คำแนะนำในการซ่อม เพิ่มประสิทธิภาพ หรือเพิ่มความสมบูรณ์ให้กับชุดข้อมูลจะกำหนดตามประเภทข้อมูล

ตัวอย่างของคำแนะนำประเภทของรูปแบบภาษามีดังต่อไปนี้

  • การเพิ่มความสมบูรณ์ - การเพิ่มคอลัมน์ใหม่ในข้อมูลของคุณซึ่งตรงกับประเภทข้อมูลที่ตรวจพบ เช่น ตำแหน่งทางภูมิศาสตร์ ตัวอย่างเช่น การเพิ่มข้อมูลประชากรสำหรับเมือง
  • การเชื่อมต่อคอลัมน์ - เมื่อตรวจพบสองคอลัมน์ในชุดข้อมูล คอลัมน์หนึ่งมีข้อมูลชื่อและอีกคอลัมน์หนึ่งมีข้อมูลนามสกุล ระบบจะแนะนำให้เชื่อมต่อเป็นคอลัมน์เดียว ตัวอย่างเช่น คอลัมน์ first_name_last_name
  • การดึงข้อมูลรูปแบบภาษา - เมื่อประเภทรูปแบบภาษาประกอบด้วยประเภทย่อย เช่น หมายเลข us_phone ซึ่งมีรหัสทางไกล ระบบจะแนะนำให้ดึงข้อมูลประเภทย่อยลงในคอลัมน์ของตนเอง
  • การดึงข้อมูลของส่วน - เมื่อตรวจพบตัวคั่นของรูปแบบทั่วไปในข้อมูล ระบบจะแนะนำให้ดึงข้อมูลของส่วนจากรูปแบบนั้น ตัวอย่างเช่น ถ้าระบบตรวจพบเครื่องหมายขีดกลางที่ปรากฏซ้ำในข้อมูล ระบบจะแนะนำให้ดึงข้อมูลของส่วนนั้นเป็นคอลัมน์แยกต่างหาก เพื่อทำให้ข้อมูลมีประโยชน์สำหรับการวิเคราะห์
  • การดึงข้อมูลวันที่ - เมื่อตรวจพบวันที่ ระบบจะแนะนำให้ดึงข้อมูลของส่วนวันที่ที่อาจเสริมการวิเคราะห์ข้อมูล ตัวอย่างเช่น คุณสามารถดึงข้อมูลวันของสัปดาห์จากวันที่ในใบแจ้งหนี้หรือวันที่จัดซื้อ
  • การเข้ารหัส/การปกปิด/การลบข้อมูลทั้งหมดหรือบางส่วน - เมื่อตรวจพบฟิลด์ที่มีความละเอียดอ่อน เช่น หมายเลขบัตรเครดิต ระบบจะแนะนำให้ปกปิดคอลัมน์ทั้งหมดหรือบางส่วน หรือลบข้อมูลนั้นออก

ประเภทรูปแบบภาษาที่อ้างอิงรูปแบบที่รู้จัก

ประเภทรูปแบบภาษาถูกระบุตามรูปแบบที่พบในข้อมูลของคุณ

มีการให้คำแนะนำสำหรับรูปแบบภาษาเหล่านี้

  • วันที่ (ในรูปแบบมากกว่า 30 รูปแบบ)
  • เลขที่ประกันสังคม (SSN) ของสหรัฐอเมริกา
  • หมายเลขบัตรเครดิต
  • แอททริบิวของบัตรเครดิต (CVV และวันที่หมดอายุ)
  • อีเมล์แอดเดรส
  • หมายเลขโทรศัพท์ของอเมริกาเหนือ
  • ที่อยู่ของสหรัฐอเมริกา

ประเภทรูปแบบภาษาที่อ้างอิง

การรับรู้ประเภทรูปแบบภาษากำหนดโดยข้อมูลอ้างอิงที่โหลดจากบริการ

มีการให้คำแนะนำแบบอ้างอิงสำหรับรูปแบบภาษาแต่ละประเภทเหล่านี้

  • ชื่อประเทศ
  • รหัสประเทศ
  • ชื่อรัฐ (จังหวัด)
  • รหัสรัฐ
  • ชื่อประเทศ (เขตอำนาจศาล)
  • ชื่อเมือง (ชื่อที่โลคัลไลซ์)
  • รหัสไปรษณีย์

การเพิ่มความสมบูรณ์ที่แนะนำ

การเพิ่มความสมบูรณ์ที่แนะนำจะอิงตามประเภทของรูปแบบภาษา

การเพิ่มความสมบูรณ์จะกำหนดตามลำดับชั้นของที่ตั้งทางภูมิศาสตร์

  • ประเทศ
  • จังหวัด (รัฐ)
  • เขตอำนาจศาล (เขต)
  • ลองจิจูด
  • ละติจูด
  • ประชากร
  • ระดับความสูง (เป็นเมตร)
  • โซนเวลา
  • รหัส ISO ของประเทศ
  • Federal Information Processing Series (FIPS)
  • ชื่อประเทศ
  • เมืองหลวง
  • ทวีป
  • GeoNames ID
  • ภาษาที่ใช้
  • รหัสประเทศของโทรศัพท์
  • รูปแบบของรหัสไปรษณีย์
  • แบบแผนของรหัสไปรษณีย์
  • รหัสประเทศของโทรศัพท์
  • ชื่อสกุลเงิน
  • ตัวย่อของสกุลเงิน
  • โดเมนระดับบนสุดของภูมิศาสตร์ (GeoLTD)
  • ตารางกิโลเมตร

เกณฑ์ที่กำหนด

กระบวนการทำโปรไฟล์จะใช้เกณฑ์เฉพาะเพื่อตัดสินใจเกี่ยวกับประเภทรูปแบบภาษาบางอย่าง

โดยทั่วไปแล้ว 85% ของค่าข้อมูลในคอลัมน์ต้องตรงกับเกณฑ์สำหรับประเภทของรูปแบบภาษาเดี่ยวเพื่อให้ระบบกำหนดการจัดประเภทได้ ด้วยเหตุนี้ คอลัมน์ที่อาจมีชื่ออยู่ 70% และ “อื่นๆ” 30% จะไม่ตรงตามข้อกำหนดเกณฑ์ขั้นต่ำ และระบบจะไม่ให้คำแนะนำ

คำแนะนำความรู้ที่กำหนดเอง

ใช้คำแนะนำความรู้ที่กำหนดเองเพื่อเสริมความรู้ระบบของ Oracle Analytics ความรู้ที่กำหนดเองช่วยให้ตัวทำโปรไฟล์รูปแบบภาษาของ Oracle Analytics สามารถระบุประเภทรูปแบบภาษาแบบเจาะจงธุรกิจได้มากขึ้น และให้คำแนะนำการเพิ่มความสมบูรณ์ของข้อมูลที่เกี่ยวข้องและควบคุมได้ดีกว่าเดิม ตัวอย่างเช่น คุณอาจเพิ่มการอ้างอิงความรู้ที่กำหนดเองเพื่อจัดประเภทยาตามใบสั่งแพทย์เป็นยา USP ชนิด Analgesics หรือ Opioid

ไอคอนแนะนำการใช้งาน แนะนำการใช้งาน

ขอให้ผู้ดูแลระบบอัปโหลดไฟล์ความรู้ที่กำหนดเองไปยัง Oracle Analytics เมื่อคุณเพิ่มความสมบูรณ์ให้กับชุดข้อมูล Oracle Analytics จะเสนอคำแนะนำการเพิ่มความสมบูรณ์ตามข้อมูลรูปแบบภาษานี้ เมื่อคุณสร้างเวิร์กบุค คุณสามารถรวมการการเพิ่มความสมบูรณ์ของความรู้ลงในการแสดงข้อมูลของคุณได้เช่นกัน โดยการเพิ่มจากแผงข้อมูล

การสร้างไฟล์ความรู้ที่คุณกำหนดเอง

เมื่อคุณสร้างไฟล์รูปแบบภาษา ให้ทำตามหลักเกณฑ์ต่อไปนี้

  • สร้างไฟล์ข้อมูลในรูปแบบ CSV หรือ Microsoft Excel (XLSX) ขนาดไฟล์สูงสุดที่คุณอัปโหลดได้คือ 250 MB
  • ป็อปปูเลทคอลัมน์แรกด้วยคีย์ ซึ่ง Oracle Analytics จะใช้เพื่อทำโปรไฟล์ข้อมูล ตัวอย่างเช่น คีย์อาจเป็นวันที่ที่มีความละเอียดของวันเพื่อใช้งานข้อมูลที่จะวิเคราะห์ตามปีการเงิน
  • ป็อปปูเลทคอลัมน์อื่นๆ ด้วยค่าการเพิ่มความสมบูรณ์

ขอให้ผู้ดูแลระบบอัปโหลดไฟล์ความรู้ที่กำหนดเองไปยัง Oracle Analytics

ตัวอย่าง - ใช้งานกรอบเวลาของธุรกิจร่วมกับข้อมูลของคุณ

ตัวอย่างนี้แสดงวิธีที่คุณสามารถเพิ่มกรอบเวลาของธุรกิจในข้อมูลการขาย และใช้งานการวิเคราะห์ยอดขายแยกตามปีการเงิน หากชุดข้อมูลเดิมไม่มีข้อมูลทางการเงิน

การแสดงข้อมูลตัวอย่างแสดงยอดขายแยกตามไตรมาสในปี 2019, 2020, 2021, 2022 และ 2023 โดยแต่ละปีจะแสดงเป็นสีที่ต่างกัน คุณไม่มีข้อมูลทางการเงินในข้อมูลการขายที่มาของคุณ คุณจึงใช้งานความรู้ที่กําหนดเองเพิ่มเติมเพื่อเพิ่มข้อมูลทางการเงินในชุดข้อมูลของคุณ

ขั้นแรก คุณจัดเตรียมข้อมูลทางการเงินในไฟล์ Fiscal Calendar.xlsx ไฟล์ของคุณมีวันที่ (dd-mm-yyyy), ปีการเงิน, เดือนตามปีการเงิน และสัปดาห์ตามปีการเงิน ตัวอย่างเช่น ไฟล์ที่มาของคุณอาจมี 01-23-2025 ในคอลัมน์วันที่, 2025 ในคอลัมน์ปีการเงิน และแอททริบิวที่ต้องป้อนสําหรับคอลัมน์ที่เหลือ

ขอให้ผู้ดูแลระบบของคุณอัปโหลด Fiscal Calendar.xlsx ไปยังพื้นที่ความรู้ที่กําหนดเองในคอนโซล

จากนั้น คุณจะสร้างชุดข้อมูลที่มียอดขายและ ORDER_DATE และในโปรแกรมแก้ไขชุดข้อมูล ให้เลือก เพิ่มความสมบูรณ์ของ ORDER_DATE ด้วยปีการเงิน และ เพิ่มความสมบูรณ์ของ ORDER_DATE ด้วยเดือนตามปีการเงิน ในคําแนะนําการเพิ่มความสมบูรณ์ Oracle Analytics จะเพิ่มการเพิ่มความสมบูรณ์สองรายการในชุดข้อมูล

สุดท้าย คุณสร้างเวิร์กบุคและเพิ่ม ปีการเงิน และ ไตรมาสตามปีการเงิน (ใน ORDER_DATE) และ ยอดขาย ในการแสดงข้อมูล หมายเหตุ: คุณสามารถเพิ่ม ปีการเงิน และ ไตรมาสตามปีการเงิน ได้โดยตรงโดยไม่ต้องเพิ่มคอลัมน์ ORDER_DATE เดิม