P的ANDA庫是數據科學家的事實上的標準工具,時下。它被全球許多數據科學家廣泛使用。熟悉它之后,無論我從事什么項目,我總是將其用于處理表結構數據。它工作快速可靠,支持CSV,Excel,JSON等。但是,作為一個有SQL經驗的人,一開始我在操作表(aka DataFrames)時遇到了一些困難和困惑。最終,我了解了更多的API和正確執行操作的方法。我相信許多對熊貓邁出第一步的人可能都有相同的經歷。前段時間,我使用SQL查詢及其在Pandas中的類比編寫了備忘單。我很高興與大家分享。在這篇文章中,將使用“ SELECT”共享查詢。稍后,我將向熊貓發布其他查詢及其類比。我很高興收到您關于備忘單的反饋和愿望清單。
我們有三個簡單的表:
· 使用者
· 培訓班
· 出勤率
其余的查詢將涉及對它們的數據操作。
讓我們從基本的SELECT命令開始。
· 選擇*來自用戶
· 選擇*來自用戶LIMIT 0,10
· 選擇*來自用戶,電子郵件為空
· 從用戶中選擇名字,姓氏
· SELECT DISTINCT birth_year來自用戶
基本的數學和算術運算。
· 從用戶中選擇AVG(點);
· 從用戶中選擇總和(點);
有條件的操作和喜歡。
· 選擇*從1998年至2018年之間的出生年齡的用戶
· SELECT * FROM users where where first_name LIKE'Ch%'
· SELECT * FROM users where where first_name LIKE'%es'
· SELECT * FROM users where where first_name LIKE'%on%'
· 從用戶那里選擇first_name,last_name,例如first_name,例如'%on%'
我用JOIN和ORDER BY相關的SQL查詢來結束這篇文章。為了使代碼更簡單易讀,我將結果分配到新變量中,并在下一個變量中重新使用它們。
· SELECT * FROM出勤atn
· LEFT JOIN用戶usr ON atn.user_id = usr.id
現在讓我們將上面的結果與課程標題一起加入。其結果將與以下SQL命令的結果相同。
· SELECT * FROM atn atn
· LEFT JOIN用戶usr ON atn.user_id = usr.id
· LEFT JOIN課程co ON co.id = atn.course_id
上面的查詢將返回包含所有列的完整表/數據框。要選擇必要的列,我們可以使用與以前相同的方法。
· SELECT * FROM users ORDER BY first_name,last_name
· SELECT * FROM users ORDER BY first_name,last_name DESC
· SELECT first_name,last_name,birth_year,
· 積分,course_name,講師FROM出勤atn
· LEFT JOIN用戶usr ON atn.user_id = usr.id
· LEFT JOIN課程co ON co.id = atn.course_id
· ORDER BY first_name,last_name
以上就是關于適用于SQL人員的Pandas速查表的全部內容,想了解更多關于SQL數據庫的信息,請繼續關注中培偉業。