https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/issue/feedCENDERAWASIH : Journal of Statistics and Data Science2024-08-15T03:12:39+00:00Bobi Frans Kuddicenderawasihjournal@gmail.comOpen Journal Systemshttps://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/45ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENDAPATAN UMKM DI KECAMATAN JAYAPURA UTARA2024-07-26T16:57:41+00:00Deviana Herawatidevianaherawati321@gmail.comOckta Indriani Cahyaningtiyasocktaindriani742@gmail.comRadian Januari Situmeangradian.situmeang@gmail.com<p>Penelitian ini bertujuan untuk mengetahui faktor-faktor yang mempengaruhi pendapatan UMKM di Kecamatan Jayapura Utara. Data yang digunakandalam penelitian ini merupakan hasial survei wawancara pelaku UMKM di Kecamatan Jayapura Utara. Metode yang digunakan yaitu analisis regresi logistik , uji kesesuaian model, dan uji ketepatan klasifikasi model. Hasil yang diperoleh yaitu model logistik . Dimana, apabila ada perubahan pada variabel lokasi modal, jam kerja, lama usaha, pendidikan terakhir, jenis kelamin dan jumlah tenaga kerja maka tidak akan ada perubahan pendapatan UMKM di Kecamatan Jayapura Utara. Dengan menggunakan taraf nyata 5%, maka diperoleh faktor-faktor yang mempengaruhi pendapatan UMKM di Kecamatan Jayapura Utara yaitu modal dan tenaga kerja, dimana model yang digunakan sesuai dan ketepatan klasifikasinya yaitu sebesar 79,7%.</p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/122PEMILIHAN METODE KLASIFIKASI TERBAIK ANTARA LOGISTIC REGRESSION DAN DECISION TREE PADA DATASET HEPATITIS2023-12-07T13:31:17+00:00Desi Rahmawatidesirahmawatiii25@gmail.comAginda Ersita Marurukaginda0708@gmail.comCaecilia Bintang Girik Allobintanggirikallo@gmail.com<p>Hepatitis merupakan penyakit peradangan pada hati yang dapat disebabkan oleh berbagai macam penyebab, termasuk infeksi virus atau paparan zat beracun. Penerapan proses <em>data mining</em> untuk mengekstrak informasi dari data medis dan klinis. Dengan menggunakan metode ini, kondisi pasien di masa depan dapat diprediksi berdasarkan observasi data pasien lain atau pasien masa lalu. Penelitian ini bertujuan untuk menerapkan proses data mining dan melakukan perbandigan metode klasifikasi yaitu <em>Logistic</em> <em>Regression </em>dan <em>Decision Tree</em> menggunakan dataset Hepatitis. Berdasarkan hasil perbandingan diperoleh nilai accuracy <em>Logistic</em> <em>Regression</em> sebesar 80,207%. Sedangkkan metode <em>Decision Tree</em> menghasilkan nilai accuracy sebesar 83,195%. Maka dapat disimpulkan bahwa hasil perbandingan metode terbaik yaitu <em>Decision Tree</em>.</p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/124PERBANDINGAN KINERJA MODEL LINEAR DISCRIMINANT ANALYSIS DAN DECISSION TREE PADA STUDI KASUS DATASET AUDIT DATA2023-12-11T09:43:45+00:00Wahyu Aprillia Sariwaprilliasa@gmail.comFebryana D. Hanafidianhanafi407@gmail.comHalle F. P. Watoryfennywatory@gmail.comMuhammad Asghar Nazalasghar.nazalm@gmail.com<p>Penelitian ini akan membandingkan dua metode penambangan data yang umum digunakan, yaitu<em> Linear Discriminant Analysis </em>(LDA) dan <em>Decission Tree</em> dengan nilai <em>accuracy</em> 99,6% memiliki kinerja lebih baik dan relatif optimal pada <em>dataset</em> <em>audit data</em>. Dengan tujuan mengoptimalkan analisis statistik <em>audit data</em>, pengujian ini mengidentifikasi model mana yang lebih baik dan relatif optimal pada <em>dataset</em> <em>audit data</em>. Penelitian dilakukan untuk membandingkan performa <em>machine learning</em> dengan memilih subkumpulan fitur yan relevan dari data. Perbandingan dengan menggunnakan nilai <em>accuracy </em>menunjukkan jika model <em>Decission Tree </em>dan hasil <em>accuracy</em> sebesar 99,6%.</p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/140Clustering Kabupaten/Kota Di Provinsi Papua Berdasarkan Indikator Kemiskinan Menggunakan Metode K-Medoids2023-12-21T06:03:15+00:00Desi Rahmawatidesirahmawatiii25@gmail.comAginda Ersita Marurukaginda0708@gmail.comCaecilia Bintang Girik Allobintanggirikallo@gmail.com<p style="font-weight: 400;">Badan Pusat Statistik (BPS) telah merilis berbagai variabel terkait informasi kemiskinan tingkat kabupaten/kota di Indonesia pada tahun 2020. Angka kemiskinan tiap kabupaten/kota di Indonesia berbeda-beda. Perbedaan ini disebabkan oleh banyak indikator yang berbeda seperti: indeks pembangunan manusia, angka penduduk, pendapatan per kapita, angka melek huruf, akses terhadap pendidikan, akses terhadap air bersih dan kualitas yang cukup, dll. Sehingga digunakan metode <em>clustering</em> <em>K</em><em>-M</em><em>edoids</em> untuk mengelompokkan berdasarkan indikator-indikator tersebut. Algoritma <em>K</em><em>-</em><em>Medoids</em> merupakan salah satu metode <em>clustering</em> yang diusulkan untuk mengatasi kelemahan algoritma <em>K</em><em>-M</em><em>eans</em> yang sensitif terhadap outlier karena suatu objek dengan nilai yang tinggi dapat menyimpang secara signifikan dari sebaran datanya. Algoritm <em>K</em><em>-M</em><em>edoids</em> menggunakan data alih-alih merata-ratakan pusat cluster. Dengan menggunakan analisis <em>K-Medoids</em> diperoleh <em>cluster </em>optimal sebanyak 2 <em>cluster</em> yang dikategorikan sebagai Kabupaten/Kota dengan indikator kemiskinan sedang dan tinggi dari 29 kabupaten/kota, dimana pada cluster 1 dengan 17 Kabupaten/Kota tergolong kemiskinan tinggi karena pada <em>cluster</em> ini Indeks Pembangunan Manusia dan Laju Pertumbuhan PDRB tergolong rendah dan Persentase Penduduk Miskin tinggi.Untuk <em>cluster</em> 2 dengan 12 Kabupaten/kota tergolong kemiskinan sedang karena pada <em>cluster</em> ini Indeks Pembangunan Manusia dan Laju Pertumbuhan PDRB tinggi sedangkan Persentase Penduduk Miskin rendah. </p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/141CLUSTERING DATASET CUSTOMERS DENGAN MENGGUNAKAN METODE K-MEANS2023-12-21T22:39:27+00:00Rosy Latunusarosylatunusa12@gmail.comNiswa Nilhaya M.niswanilhaya@gmail.comCaecilia Bintang Girik Allobintanggirikallo@gmail.com<p>Keunggulan kompetitif yang berkelanjutan sangat penting bagi sebagian besar perusahaan yang ingin mempertahankan atau memperluas posisinya dan mengoptimalkan probabilitas dan pertumbuhan keuntungannya. Keunggulan yang baik adalah yang dapat menarik klien/pelanggan. Segmentasi pelanggan sangat penting untuk mencapai misi ini. Teknik clustering dapat membantu dalam pengelompokan pelanggan dalam membuat kelompok yang terdiri objek target berdasarkan informasi dalam data yang membedakan objek dan hubungan di antara objek tersebut. Dengan mengelompokkan pelanggan ke dalam beberapa kelompok dapat membedakan antara pelanggan yang lebih disukai dan yang kurang disukai. Pada hal ini kami menyelidiki masalah audit internal yang terkait dengan protokol dengan tujuan untuk melihat nilai yang diberikan oleh mall kepada customer berdasarkan perilaku customer. Algoritma clustering yang digunakan adalah algoritma K-means. Pada metode algoritma K-Means diperoleh jumlah cluster dengan metode elbow yaitu k = 2. Cluster yang terbentuk yaitu cluster 1 dengan jumlah 11 pelanggan yang dan cluster 2 dengan jumlah 14 pelanggan.</p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/142ANALISIS PERBANDINGAN METODE FEATURE SELECTION BACKWARD METHOD DAN STEPWISE METHOD2023-12-22T08:18:00+00:00Natasya Parendencacamoraaa3@gmail.comNurfadillahnurfadillah240812@gmail.comMaria F. Barek Bungabarekbunga0502@gmail.com<p style="font-weight: 400;"><em>Feature selection is an important process in the development of machine learning models to identify the most informative and relevant features in a dataset. Two commonly used methods for feature selection are the forward method and the backward method. In this research, a Data Mining feature selection technique is applied to compare the two Feature Selection methods, namely the Backward Method and the Stepwise Method, based on accuracy values. The results obtained from the comparison of accuracy values of Feature Selection, namely Backward Method and Stepwise Method, using the Students Performance dataset, show that both models are comparable. They are considered comparable because, based on their accuracy values, both the Backward Method and Stepwise Method have the same accuracy of 0.61 or 61%.</em></p> <p style="font-weight: 400;"><strong><em>Keywords:</em></strong><em> Comparison, Feature Selection, Backward Method, Stepwise Method.</em></p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/152ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI INDEKS PEMBANGUNAN MANUSIA DI PROVINSI PAPUA MENGGUNAKAN REGRESI DATA PANEL2024-01-25T15:49:25+00:00Niswa Nilhaya M.niswanilhaya@gmail.comBobi Frans Kuddibobikuddi@gmail.com<p>Secara umum pembangunan merupakan suatu proses perubahan ke arah yang lebih baik . Upaya tersebut dilakukan secara terencana dengan tujuan untuk meningkatkan kesejahteraan masyarakat. Dalam upaya mencapai tujuan pembangunan tersebut akan selalu ada dampak yang baik, dampak positif dan negatif. Oleh karena itu, perlu adanya indikator sebagai acuan bila terjadi perkembangan ini. Penelitian bertujuan untuk mengetahui faktor-faktor yang mempengaruhi indeks pembangunan manusia di Provinsi Papua dan menentukan model regresi data panel yang terbaik untuk menganalisis faktor-faktor yang mempengaruhi indeks pembangunan di Provinsi Papua. Berdasarkan hasil pengujian model regresi data panel menggunakan <em>Uji Chow</em> dan <em>Uji Hausman</em>, diperoleh model terbaik untuk menganalisis faktor-faktor yang mempengaruhi indeks pembangunan manusia di Provinsi Papua adalah model <em>fixed effect</em> sebagai berikut.</p> <p>Y = 55,47961 - 0,004332X1 + 0,025029X2 + 0,042769X3 dan berdasarkan hasil pengujian signifikansi parameter model regresi diperoleh Laju Pertumbuhan PDRB, Tingkat Kemiskinan dan Rasio Gini mempengaruhi Indeks Pembangunan Manusia di Provinsi Papua.</p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/162ANALISIS PEMBENTUKAN PORTOFOLIO OPTIMAL MENGGUNAKAN PENDEKATAN SINGLE INDEX MODEL PADA SAHAM INDEX IDXHIDEV202024-03-04T09:41:49+00:00Shevania Mathelda Ardamismthldaardamis@gmail.comFebryana Dian Hanafidianhanafi407@gmail.comRadian Januari Situmeangradian@fmipa.uncen.ac.id<p>Investasi dalam saham adalah langkah menyuntikkan modal dengan harapan mendapatkan pengembalian di masa depan, termasuk dividen dan capital gain, sebagai imbalan atas risiko yang diambil pada saat ini. Penting untuk diingat bahwa investasi saham melibatkan risiko, dengan nilai saham yang dapat berfluktuasi bergantung pada faktor-faktor seperti kinerja perusahaan, kondisi pasar, dan situasi ekonomi global. Data survei yang digunakan adalah data historis, dikumpulkan melalui survei internet terhadap harga penutupan saham perusahaan di indeks IDXHIDEV20 dari Januari 2022 hingga Oktober 2023. Portofolio optimal, dalam penelitian ini, memiliki expected return sebesar 9,85%, menunjukkan tingkat pengembalian yang diharapkan dari investasi. Risiko portofolio tersebut sebesar 0,68%, mencerminkan sejauh mana fluktuasi atau volatilitas nilai investasi dalam portofolio tersebut. Dengan risiko yang relatif rendah, portofolio ini dianggap optimal karena mencapai tingkat pengembalian yang tinggi dengan risiko minimal.</p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/176ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI TINGKAT KELUMPUHAN PENDERITA STROKE DENGAN METODE REGRESI LOGISTIK MULTINOMIAL 2024-06-02T03:27:15+00:00Nicea Roona Paranoannicearoona12@gmail.comCaecilia Bintang Girik Allocaecilia.bintang@fmipa.uncen.ac.id<p>Stroke adalah suatu gangguan fungsi otak yang terjadi secara mendadak, disebabkan semata-mata oleh gangguan saraf (deficit neurologis) fokal atau global, yang berlangsung lebih dari 24 jam. Menurut WHO stroke merupakan salah satu dari sepuluh penyakit yang menyebabkan kematian. Di Indonesia sendiri stroke menjadi penyebab 15,4% kematian dari total kasus kematian akibat penyakit. Sebanyak 2,5% dari pasien stroke meninggal dunia dan sisanya akan mengalami kecacatan yang beratnya bervariasi. Penelitian ini dilakukan untuk mengetahui faktor-faktor yang mempengaruhi tingkat kelumpuhan stroke di RSU Haji Surabaya. Dimana faktor-faktor yang mempengaruhi tingkat kelumpuhan stroke pada penelitian ini adalah meliputi jenis kelamin, usia, hipertensi dan diabetes militus. Dari data tersebut akan dilakukan pemodelan terhadap tingkat kelumpuhan stroke beserta faktor-faktor ynag mempengaruhi dengan mengguanakan regresi logistik multinomial. Untuk melihat seberapa berpengaruhnya dari variabel prediktor ini akan diuji baik secara serentak maupun secara parsial. Berdasarkan pengujian tersebut didapatkan kesimpulan bahwa secara serentak keempat variabel prediktor tersebut berpengaruh secara signifikan. Sedangkan berdasarkan pengujian secara parsial variabel yang berpengaruh secar signifikan adalah variabel hipertensi dan variabel diabetes militus. Dari model ynag telah dibuat dapat ditarik kesimpulan bahwa model telah sesuai.</p>2024-06-30T00:00:00+00:00Copyright (c) 2024 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/202MODELLING SARDINE FISHING IN PAPUA USING COMMON NEAREST NEIGHBOR CLUSTERING2024-08-15T03:12:39+00:00Aryanto Aryantoaryanto.dandan@gmail.com<p>Papua and Papua Barat provinces, Indonesia, possess a rich marine tapestry woven with the thread of sardine fish, a cornerstone of commercial fisheries. Understanding the spatial distribution of sardine catches is crucial for sustainable resource management and economic development. This study investigates the application of Common Nearest Neighbor Clustering (CNNC) on Sardines catch data from Papua and Papua Barat Province. To address potential multi-collinearity among these attributes, Principal Component Analysis (PCA) was employed as a preprocessing step. The clustering algorithm was optimized with an epsilon parameter of 0.65 and a leaf size of 30, yielding a silhouette score of 0.224373, which indicates moderate clustering quality. The analysis resulted in the identification of seven distinct clusters within the data, providing valuable insights into the distribution and characteristics of Sardines catches across the region. The findings contribute to the understanding of fisheries management in Papua and Papua Barat, with implications for policy and resource allocation. The results of this research contribute to a nuanced understanding of sardine catch distribution in Papua and Papua Barat. By identifying regional clusters, policymakers can tailor fisheries management strategies to specific needs, ensuring the long-term sustainability of this vital resource. Furthermore, the findings provide insights for stakeholders in the fishing industry to optimize operations and enhance economic benefits. This study underscores the importance of spatial analysis in unraveling the complexities of marine ecosystems and supports informed decision-making for the sustainable utilization of marine resources.</p>2024-05-31T00:00:00+00:00Copyright (c) 2024