Food Recommendation according to Nutritional Open Dataset
Download
Report
Transcript Food Recommendation according to Nutritional Open Dataset
Food Recommendation
according to
Nutritional Open Dataset
任啟綱@綠光能數位有限公司
鄭嘉欣@清水傳股份有限公司
2014.12
Dataset
Government open dataset
食品營養成分資料集
http://data.fda.gov.tw/opendata/exportDataList.do?method=
ExportData&InfoId=20&logType=3
Data Organizing
Dataset in ZIP format
Need to unzip first
Use function of unzip()
Dataset in JSON format
Remove names
Data.frame versus List
Table is easier to operate in this case
Redundant columns
We do not need all columns in dataset to do analysis
Domain Knowledge
Reference
營養與運動 – 臺北醫學大學 – 保健營養學系
http://nutri1.tmu.edu.tw/doc/chao/04.pdf
日常飲食
醣類(熱量)
蛋白質(肌肉)
營養性體力增補劑
葡萄糖、蔗糖、果糖(體力、耐力)
蛋白質(肌肉)
維生素B1、維生素B2、維生素B12(鎮定)
維生素B6(熱量轉換)
維生素E 、維生素C 、 β-胡蘿蔔素(消除自由基)
鐵(攜氧能力)
鈉、鉀(補充電解質、防止抽筋)
Query 1 – Top 10 of
高總碳水化合物(醣類)的食物
冰糖
方糖
紅茶沖泡包(檸檬)
紅砂糖
糖粉
薑茶沖泡包
苦茶糖
維生素C口含錠(檸檬)
枇杷糖
蓮藕糖
Query 2 – Top 10 of
高水解胺基酸總量的食物
柴魚片
扁魚干
小魚干
干貝(加工)
小卷干
櫻花蝦(加工)
干貝平均值(加工)
蝦米
鯊魚翅
乾酪粉
Query 3 – Top 10 of
高葡萄糖、蔗糖、果糖的食物
芋頭粉
梅子粉
甜酒釀
純杏仁粉
味醂
乾姬松茸
山葵醬
味噌
紅麴醬
黑芝麻麵包醬
•
•
•
•
•
•
•
•
•
•
糖粉
黑糖蜜
加糖部份脫脂煉乳
煎餅
巧克力醬(液體)
麵茶粉
海鮮醬
法式奶酥醬
生栗子
銅鑼燒
•
•
•
•
•
•
•
•
•
•
味醂
乾猴頭菇
五味醬
紅胡椒粒
南華蕉
日式照燒醬
巨峰葡萄
紅皮蕉
李林蕉
津經蜜蘋果
(梨山)
Query 4 – Top 10 of
高維生素B1、B2、B12的食物
米胚芽
切片火腿(豬肉
)
小麥胚芽
速食乾麵醬包(
麻醬)
葵瓜子
高湯塊(排骨)
絲瓜花
高湯塊(雞肉)
麥片沖泡包(三
合一)
1酵母菌咀嚼錠
•
•
•
•
•
•
•
•
•
•
酵母粉
膽肝
醃燻豬肝
麥片沖泡包(三合一)
脫脂強化奶粉(鈣&維
生素A強化)
脫脂奶粉(即溶)
部份脫脂調味奶粉(
果汁)
脫脂奶粉平均值
乾鈕釦菇
脫脂奶粉
•
•
•
•
•
•
•
•
•
•
台灣蜆
九孔螺
紫菜
鵝肝
熟紫菜
小魚干
牡蠣干
文蛤
鮟鱇魚肝
醃燻豬肝
Query 5 – Top 10 of
高維生素B6的食物
薤
愛玉子
辣椒粉
金針菜乾
朝天椒(圓果)
海帶茸
麥片沖泡包(三合一)
羅勒片
沙茶粉
蒜粉
Query 6 – Top 10 of
高維生素E 、C 、 β-胡蘿蔔素的食物
荳蔻粉
白芝麻麵包醬
黑芝麻麵包醬
黑芝麻油
炸醬
咖哩粉
紅辣椒油
素沙茶醬
七味唐辛子
大豆油
• 維生素C口含錠(檸
檬)
• 維生素強化飲料(維
生素C)
• 香樁
• 珍珠芭樂
• 朝天椒(長果)
• 牛肉火腿(黑胡椒)
• 紅辣椒平均值
• 長辣椒(青皮)
• 長辣椒(紅皮)
• 牛乳芭樂
•
•
•
•
•
•
•
•
•
•
荷蘭豆菜心
火炭母草
冷凍胡蘿蔔
乾海帶
澳洲胡蘿蔔(
細長型)
洋香菜片
朝天椒(長果)
櫻桃小番茄
食茱萸
美國空心菜
Query 7 – Top 10 of
高鐵的食物
咖哩粉
紫菜
甘草粉
白胡椒粉
洋香菜片
羅勒片
鵝肝
小茴香粉
髮菜
熟紫菜
Query 8 – Top 10 of
高鈉、鉀的食物
岩鹽
低鈉鹽
鮮雞精
乾麒麟菜
高湯塊(排骨)
高鮮味精
味精
梅乾菜
梅子粉
•
•
•
•
•
•
•
•
•
•
低鈉鹽
小茴香粉
薑粉
乾海帶
可可粉
西洋芹菜片
即溶咖啡粉
雞腿菇
乾猴頭菇
日本銀帶鯡
Thoughts
Data organization (data cleaning) was a bit troublesome
Need domain knowledge to know what to analyze