R – บันทึกและโหลดข้อมูลของ R object ไว้ในรูปแบบไฟล์

เมื่อวันก่อนได้มีโอกาสทดลงสร้างรายงานจากไฟล์ในรูปแบบ Rmarkdown(.rmd) ซึ่งการสร้างรายงานในรูปแบบไฟล์นี้ จะเป็นรายงานที่มีทั้งข้อความอธิบายเนื้อหา, มีโค้ดภาษา R ที่สามารถเพิ่มขึ้นมาใช้อธิบายประกอบขั้นตอนการวิเคราะห์ข้อมูล พร้อมทั้งยังสามารถแสดงผลข้อมูลโค้ดดังกล่าวในรูปแบบตัวอักษร, โค้ดอธิบายการคำนวณ พร้อมกับรันโปรแกรมในส่วนของโค้ดดังกล่าวแล้วเอาผลการรันโปรแกรมในส่วนนั้นมาแสดงต่อจากโค้ดนั้นได้เลย ซึ่งผลที่ได้จากการรันโปรแกรมก็อาจจะเป็นได้ทั้งตัวหนังสือ, ตัวเลข, กราฟ หรือข้อมูลรูปแบบอื่นๆ ที่เกิดจากการประมวลผลโค้ดในส่วนนั้น ไฟล์ .rmd มีประโยชน์มาก เพราะบางทีที่เราต้องการจะเอาโค้ดภาษา R ส่งไปให้คนอื่นทำความเข้าใจและเพื่อจะดูผลลัพท์จากการคำนวณ หรือดูเป็นกราฟที่ประมวลผลออกมาได้จากโค้ดในส่วนนี้ แต่บางทีพอส่งแต่โค้ด .R ไป เครื่องคอมพิวเตอร์ของคนอื่นอาจจะมี library ไม่พร้อม หรือเวอร์ชันของ library ต่างๆ ไม่ตรงกันกับที่เจ้าของโค้ดใช้งาน อาจจะทำให้รันผลออกมาไม่ได้ หรือว่าบางทีค่าต่างๆ ผิดเพี้ยนไปบ้าง แต่เมื่อเป็นไฟล์รายงานที่ถูกเขียนด้วยไฟล์ .rmd เจ้าของรายงานสามารถเลือกสร้างรายงานออกมาในรูปแบบ .html, .pdf ได้ ซึ่งการสร้างรายงานออกมาในรูปแบบรายงานด้วยไฟล์ประเภทนี้ ผู้รับไฟล์สามารถเอาไฟล์ .html, .pdf ไปอ่านทำความเข้าใจได้เลย ไม่จำเป็นต้องติดตั้งโปรแกรมภาษา R ในเครื่องคอมพิวเตอร์และรันโปรแกรมซ้ำอีก และยังเป็นไฟล์ที่สามารถอ่านทั้งข้อมูลที่เป็นส่วนอธิบายโปรแกรม, ส่วนของโค้ดที่ใช้เขียนโปรแกรมนั้น และผลลัพท์ที่ได้จากการรันโปรแกรมในแต่ละส่วนๆ ย่อยๆ นั้น เนื่องจากเวลาต้องการจะกดสร้างรายงานจากไฟล์ Read more about R – บันทึกและโหลดข้อมูลของ R object ไว้ในรูปแบบไฟล์[…]

R – จะติดตั้งแพคเกจ leaflet ใช้กับ R แล้วมันมี library บางตัวที่จำเป็นต้องติดตั้งให้ ubuntu ก่อน

จะทดลองใช้ leaflet ใน R เพื่อแสดงข้อมูลในรูปแบบแผนที่ แต่ว่าพอเรียกใช้คำสั่งติดตั้งปกติใน console ของ R พอติดตั้งไปได้ครึ่งทางแล้วก็เกิด error ขึ้น ว่าหา library บางตัวไม่เจอ ทำให้ติดตั้งไม่เสร็จแล้ว error ออกมา # ติดตั้งแพคเกจ leaflet install.packages(“leaflet”) ไปนั่งอ่าน error และไปหาข้อมูลเพิ่มเติม สรุปว่ามีไลบรารี่ ที่จำเป็นต้องติดต้องให้ os เพิ่มเติมก่อน ที่ leaflet จะเรียกใช้ได้ สำหรับตอนนี้ที่ใช้ ubuntu ก็จำเป็นต้องติดตั้งไลบรารี่ เหล่านี้ให้กับ ubuntu ให้เสร็จก่อน เพราะ R เองไม่สามารถติดตั้งไลบรารี่ของ os เหล่านี้ให้เองอัตโนมัติ จำเป็นต้องติดตั้งแยก ชื่อที่ติดต้งไปก็จะมี:- libudunits2-dev libgdal-dev libgeos-dev libproj-dev รันคำสั่งติดตั้งไลบรารี่เหล่านี้ใน terminal ของ ubuntu (ต้องใช้ sudo Read more about R – จะติดตั้งแพคเกจ leaflet ใช้กับ R แล้วมันมี library บางตัวที่จำเป็นต้องติดตั้งให้ ubuntu ก่อน[…]

R – ลองใช้ dplyr กับ ggplot2 ในการจัดรูปแบบข้อมูลและพลอตเป็นกราฟแบบต่างๆดู

ช่วงนี้เป็นมือใหม่ลองใช้ภาษา R ในการจัดการข้อมูลและลองวิเคราะห์ข้อมูลพื้นฐาน ก็มาถงส่วนที่อยากทำความรู้จักกับ package dplyr กับ ggplot2 วิธีที่ดีที่สุดก็คือต้องลองใช้งานดูเยอะๆ จะได้รู้จัก package นั้นๆ ดียิ่งขึ้น Package dplyr สำหรับ package dplyr เป็น package พื้นฐานของ R ไว้สำหรับจัดการกับก้อนข้อมูลที่เรามีเช่น กรองข้อมูลเฉพาะบางคอลัมน์, กรองข้อมูลเฉพาะแถวที่มีข้อมูลบางอย่างอยู่, จัดเรียงลำดับข้อมูลที่มีตามเงื่อนไขที่ระบุ เป็นต้น ฟังก์ชันหลักๆ ของ dplyr ที่มักจะถูกเรียกใช้เพื่อจัดการข้อมูล:- filter() : มักถูกเรียกใช้เพื่อจะกรองข้อมูลของแต่ละแถว(row) ว่าข้อมูลในแถวนั้นมีข้อมูลตรงตามเงื่อนไขที่ระบุหรือไม่ ถ้าไม่มีข้อมูลก็จะถูกกรองออก เมื่อประมวลผลเสร็จก็จะคืนค่าเป็นข้อมูลใหม่ที่กรองตามเงื่อนไขเรียบร้อยแล้ว select(): มักถูกเรียกใช้เพื่อจะกรองข้อมูล จากชื่อหลัก(column)หรือจากชนิดของข้อมูล(data type)ในคอลัมน์นั้น เมื่อประมวลผลเสร็จก็จะคืนค่าเป็นข้อมูลใหม่ที่กรองตามเงื่อนไขที่ระบุไว้ arrage(): มักถูกเรียกใช้เพื่อจัดเรียงลำดับข้อมูล(มากไปน้อย, น้อยไปมาก) ตามเงื่อนไข(สามารถเลือกจัดเรียงจากข้อมูลหลักเดียว หรือ หลายหลักรวมกันได้) เมื่อประมวลผลเสร็จฟังก์ชันก็จะคืนค่าข้อมูลที่ได้รับการจัดเรียงเสร็จเรียบร้อยแล้ว mutate(): มักจะใช้สำหรับเพิ่มหลัก(column)ใหม่ ให้กับข้อมูล ซึ่งข้อมูลใหม่นั้นมักจะเป็นข้อมูลที่ได้มาจากการคำนวณจากข้อมูลเดิมที่มี เช่น คำนวณค่าเฉลี่ยจากข้อมุล Read more about R – ลองใช้ dplyr กับ ggplot2 ในการจัดรูปแบบข้อมูลและพลอตเป็นกราฟแบบต่างๆดู[…]

R – ตรวจสอบ package ที่เราต้องการเรียกใช้งานในโปรแกรม ถ้า package นั้นยังไม่ได้ติดตั้งให้โปรแกรมติดตั้งใหม่เองได้เลยอัตโนมัติ

โดยปกติเมื่อเราจำเป็นต้องเรียกใช้ฟังก์ชันจาก package ใดๆ เมื่อเริ่มต้นเขียนโปรแกรม เราจำเป็นต้องระบุให้โปรแกรมของเราโหลด package เหล่านั้นเข้ามาใน environment ที่เราทำงานอยู่เสียก่อน ถ้าในโปรแกรมของเราจำเป็นต้องเรียกใช้ฟังก์ชันที่มาจากหลายๆ package เราก็จำเป็นต้องระบุชื่อ package เหล่านั้นทั้งหมดด้วย โดยปกติในส่วนหัวของไฟล์หรือตอนต้นของโปรแกรมจะทำการเรียกโหลด package แบบนี้ # ทำการเรียกฟังก์ชัน library เพื่อโหลด package “dplyr” library(dplyr) เหตุผลที่เราจำเป็นต้องระบุชื่อ package เองเช่นนี้ ก็เป็นเพราะมี package ต่างๆ ที่นักพัฒนาจากหลายๆกลุ่มได้พัฒนาโดยใช้ภาษา R ให้เรียกใช้งานเยอะมาก แต่ละ package ก็เหมาะสำหรับทำงานในแต่ละอย่างแตกต่างกันไป ถ้าจำเป็นต้องโหลด package เหล่านั้นทั้งหมดขึ้นมาให้เราอัตโนมัติทุกครั้งที่เราใช้งานโปรแกรมใดๆ ไม่ว่าจะเป็นโปรแกรมทำงานเล็กๆ หรือทำงานใหญ่ๆ มันก็จะทำให้เครื่องคอมพิวเตอร์ที่เราทำงานอยู่จำเป็นต้องใช้หน่วยความจำและทรัพยาการเยอะจากเครื่องคอมพิวเตอร์มากจนเกินไป บางทีทรัพยาการในเครื่องคอมพิวเตอร์ที่เราทำงานอาจจะไม่เหลือพอที่จะรันโปรแกรมของเราเองด้วย ดังนั้นแทนที่จะโหลด package ที่มีอยู่มาทั้งหมด ในการเขียนโปรแกรมภาษา R ก็ออกแบบให้คนเขียนโปรแกรมสามารถเลือกโหลดเฉพาะบาง package ที่จำเป็นต้องใช้งานในโปรแกรมของเราแบบระบุเอาเอง โปรแกรมที่เราออกแบบจะได้ใช้ทรัพยาการของเครื่องคอมพิวเตอร์ของเราในการโหลด package เข้ามาใน environment Read more about R – ตรวจสอบ package ที่เราต้องการเรียกใช้งานในโปรแกรม ถ้า package นั้นยังไม่ได้ติดตั้งให้โปรแกรมติดตั้งใหม่เองได้เลยอัตโนมัติ[…]